Task 15785071

Name	hadcm3n_zhdk_1960_40_008369087_1
Workunit	8519946
Created	15 May 2013, 9:52:34 UTC
Sent	15 May 2013, 9:52:40 UTC
Report deadline	14 Aug 2013, 17:19:51 UTC
Received	30 Jun 2013, 0:31:08 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	193 (0x000000C1) EXIT_SIGNAL
Computer ID	1301521
Run time	21 days 16 hours 38 min 3 sec
CPU time	18 days 17 hours 1 min 11 sec
Validate state	Invalid
Credit	9,331.20
Device peak FLOPS	1.94 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.64</core_client_version> <![CDATA[ <message> (unknown error) - exit code 193 (0xc1) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4668, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1116, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3752, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3744, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 19:09:40 (4752): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 19:18:20 (1020): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 19:23:51 (3804): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 19:23:52 (3804): No heartbeat from core client for 30 sec - exiting 19:23:53 (3804): No heartbeat from core client for 30 sec - exiting 19:25:40 (3452): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 19:30:11 (1548): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 19:30:12 (1548): No heartbeat from core client for 30 sec - exiting 19:30:13 (1548): No heartbeat from core client for 30 sec - exiting 19:30:14 (1548): No heartbeat from core client for 30 sec - exiting 19:30:15 (1548): No heartbeat from core client for 30 sec - exiting 19:30:16 (1548): No heartbeat from core client for 30 sec - exiting 19:30:18 (1548): No heartbeat from core client for 30 sec - exiting 19:30:19 (1548): No heartbeat from core client for 30 sec - exiting 19:30:20 (1548): No heartbeat from core client for 30 sec - exiting 19:30:21 (1548): No heartbeat from core client for 30 sec - exiting 19:30:22 (1548): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3336, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Unhandled Exception Detected... - Unhandled Exception Record - Reason: Access Violation (0xc0000005) at address 0x771F3F99 read attempt to address 0xFFFFFFF8 Engaging BOINC Windows Runtime Debugger... Cannot serialize file C:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_zhdk_1960_40_008369087/dataout/shmem_restart.day Signal 11 received, exiting... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
02 Jul 2013 10:23:51	920618	15785071	hadcm3n_zhdk_1960_40_008369087_1	777,600	1,616,462	2.0788
02 Jul 2013 09:50:35	920618	15785071	hadcm3n_zhdk_1960_40_008369087_1	751,680	1,563,735	2.0803
27 Jun 2013 04:57:15	920618	15785071	hadcm3n_zhdk_1960_40_008369087_1	725,760	1,512,340	2.0838
26 Jun 2013 01:45:55	920618	15785071	hadcm3n_zhdk_1960_40_008369087_1	699,840	1,460,119	2.0864
24 Jun 2013 06:28:51	920618	15785071	hadcm3n_zhdk_1960_40_008369087_1	673,920	1,406,115	2.0865
23 Jun 2013 11:07:44	920618	15785071	hadcm3n_zhdk_1960_40_008369087_1	648,000	1,353,614	2.0889
21 Jun 2013 23:39:35	920618	15785071	hadcm3n_zhdk_1960_40_008369087_1	622,080	1,298,803	2.0878
14 Jun 2013 07:27:01	920618	15785071	hadcm3n_zhdk_1960_40_008369087_1	596,160	1,245,366	2.0890
12 Jun 2013 06:19:57	920618	15785071	hadcm3n_zhdk_1960_40_008369087_1	570,240	1,192,099	2.0905
11 Jun 2013 01:40:15	920618	15785071	hadcm3n_zhdk_1960_40_008369087_1	544,320	1,137,115	2.0891
09 Jun 2013 21:26:44	920618	15785071	hadcm3n_zhdk_1960_40_008369087_1	518,400	1,083,181	2.0895
09 Jun 2013 02:47:18	920618	15785071	hadcm3n_zhdk_1960_40_008369087_1	492,480	1,028,454	2.0883
08 Jun 2013 08:28:34	920618	15785071	hadcm3n_zhdk_1960_40_008369087_1	466,560	973,295	2.0861
07 Jun 2013 01:57:35	920618	15785071	hadcm3n_zhdk_1960_40_008369087_1	440,640	918,409	2.0843
05 Jun 2013 08:15:11	920618	15785071	hadcm3n_zhdk_1960_40_008369087_1	414,720	863,810	2.0829
04 Jun 2013 03:06:46	920618	15785071	hadcm3n_zhdk_1960_40_008369087_1	388,800	808,802	2.0803
02 Jun 2013 21:49:10	920618	15785071	hadcm3n_zhdk_1960_40_008369087_1	362,880	753,844	2.0774
02 Jun 2013 01:56:14	920618	15785071	hadcm3n_zhdk_1960_40_008369087_1	336,960	698,758	2.0737
01 Jun 2013 08:18:42	920618	15785071	hadcm3n_zhdk_1960_40_008369087_1	311,040	643,932	2.0703
31 May 2013 01:23:23	920618	15785071	hadcm3n_zhdk_1960_40_008369087_1	285,120	589,453	2.0674