Task 16014393

Name	hadcm3n_n37r_1880_40_008398772_4
Workunit	8549628
Created	13 Sep 2013, 6:05:44 UTC
Sent	13 Sep 2013, 6:32:09 UTC
Report deadline	13 Dec 2013, 13:59:20 UTC
Received	4 Oct 2013, 5:12:58 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	-1073741819 (0xC0000005) STATUS_ACCESS_VIOLATION
Computer ID	1242385
Run time	13 days 4 hours 39 min 43 sec
CPU time	12 days 20 hours 16 min 41 sec
Validate state	Invalid
Credit	6,220.80
Device peak FLOPS	3.09 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.64</core_client_version> <![CDATA[ <message> (unknown error) - exit code -1073741819 (0xc0000005) </message> <stderr_txt> 08:31:39 (7040): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 08:31:40 (7040): No heartbeat from core client for 30 sec - exiting 08:31:41 (7040): No heartbeat from core client for 30 sec - exiting 08:31:42 (7040): No heartbeat from core client for 30 sec - exiting 08:31:43 (7040): No heartbeat from core client for 30 sec - exiting 08:31:44 (7040): No heartbeat from core client for 30 sec - exiting 08:31:45 (7040): No heartbeat from core client for 30 sec - exiting 08:31:46 (7040): No heartbeat from core client for 30 sec - exiting 08:31:47 (7040): No heartbeat from core client for 30 sec - exiting 08:31:48 (7040): No heartbeat from core client for 30 sec - exiting 08:31:49 (7040): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 13:01:52 (7128): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=8888, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 08:30:52 (6160): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 08:28:34 (5188): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 10:35:51 (7912): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5336, iMonCtr=1 Model crash detected, will try to restart... 13:02:02 (6612): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4580, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 09:33:09 (4940): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3452, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5376, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5376, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Unhandled Exception Detected... - Unhandled Exception Record - Reason: Access Violation (0xc0000005) at address 0x76FB7383 read attempt to address 0xFFFFFFF8 Engaging BOINC Windows Runtime Debugger... Unhandled Exception Detected... - Unhandled Exception Record - Reason: Access Violation (0xc0000005) at address 0x77A03AC3 read attempt to address 0x00000000 Engaging BOINC Windows Runtime Debugger... </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
03 Oct 2013 08:46:06	1242385	16014393	hadcm3n_n37r_1880_40_008398772_4	518,400	1,097,371	2.1168
02 Oct 2013 15:13:56	1242385	16014393	hadcm3n_n37r_1880_40_008398772_4	492,480	1,042,551	2.1169
01 Oct 2013 21:51:10	1242385	16014393	hadcm3n_n37r_1880_40_008398772_4	466,560	986,704	2.1148
01 Oct 2013 04:43:54	1242385	16014393	hadcm3n_n37r_1880_40_008398772_4	440,640	929,626	2.1097
30 Sep 2013 10:05:52	1242385	16014393	hadcm3n_n37r_1880_40_008398772_4	414,720	869,768	2.0972
29 Sep 2013 17:43:00	1242385	16014393	hadcm3n_n37r_1880_40_008398772_4	388,800	812,037	2.0886
29 Sep 2013 01:26:28	1242385	16014393	hadcm3n_n37r_1880_40_008398772_4	362,880	754,754	2.0799
28 Sep 2013 07:39:11	1242385	16014393	hadcm3n_n37r_1880_40_008398772_4	336,960	695,462	2.0639
27 Sep 2013 13:59:41	1242385	16014393	hadcm3n_n37r_1880_40_008398772_4	311,040	634,554	2.0401
26 Sep 2013 20:38:15	1242385	16014393	hadcm3n_n37r_1880_40_008398772_4	285,120	581,756	2.0404
26 Sep 2013 02:49:44	1242385	16014393	hadcm3n_n37r_1880_40_008398772_4	259,200	524,352	2.0230
25 Sep 2013 09:23:53	1242385	16014393	hadcm3n_n37r_1880_40_008398772_4	233,280	472,634	2.0260
24 Sep 2013 02:20:49	1242385	16014393	hadcm3n_n37r_1880_40_008398772_4	207,360	421,710	2.0337
23 Sep 2013 10:09:03	1242385	16014393	hadcm3n_n37r_1880_40_008398772_4	181,440	373,095	2.0563
23 Sep 2013 10:09:03	1242385	16014393	hadcm3n_n37r_1880_40_008398772_4	155,520	321,830	2.0694
23 Sep 2013 10:09:03	1242385	16014393	hadcm3n_n37r_1880_40_008398772_4	129,600	271,143	2.0922
21 Sep 2013 13:52:13	1242385	16014393	hadcm3n_n37r_1880_40_008398772_4	103,680	220,583	2.1275
16 Sep 2013 09:32:15	1242385	16014393	hadcm3n_n37r_1880_40_008398772_4	77,760	167,072	2.1486
15 Sep 2013 17:16:31	1242385	16014393	hadcm3n_n37r_1880_40_008398772_4	51,840	110,170	2.1252
14 Sep 2013 03:00:39	1242385	16014393	hadcm3n_n37r_1880_40_008398772_4	25,920	53,968	2.0821