Task 15651145

Name	hadcm3n_n0bk_1880_40_008286947_1
Workunit	8438082
Created	6 Mar 2013, 16:48:13 UTC
Sent	6 Mar 2013, 16:48:22 UTC
Report deadline	6 Jun 2013, 0:15:33 UTC
Received	27 May 2013, 10:38:20 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	193 (0x000000C1) EXIT_SIGNAL
Computer ID	1211708
Run time	22 days 8 hours 22 min 3 sec
CPU time	17 days 2 hours 21 min 21 sec
Validate state	Invalid
Credit	9,331.20
Device peak FLOPS	2.16 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.25</core_client_version> <![CDATA[ <message> - exit code 193 (0xc1) </message> <stderr_txt> Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5028, iMonCtr=1 Model crash detected, will try to restart... 20:17:09 (5720): No heartbeat from core client for 30 sec - exiting 20:17:10 (5720): No heartbeat from core client for 30 sec - exiting 20:17:11 (5720): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 06:09:52 (2556): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5364, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5784, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5752, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5824, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5632, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3584, iMonCtr=1 Model crash detected, will try to restart... 10:17:17 (5680): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5612, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... 12:31:58 (2116): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 12:31:59 (2116): No heartbeat from core client for 30 sec - exiting 12:32:00 (2116): No heartbeat from core client for 30 sec - exiting 12:32:01 (2116): No heartbeat from core client for 30 sec - exiting 12:32:02 (2116): No heartbeat from core client for 30 sec - exiting 12:32:03 (2116): No heartbeat from core client for 30 sec - exiting 12:32:04 (2116): No heartbeat from core client for 30 sec - exiting 12:32:05 (2116): No heartbeat from core client for 30 sec - exiting 12:32:06 (2116): No heartbeat from core client for 30 sec - exiting 12:32:07 (2116): No heartbeat from core client for 30 sec - exiting 12:32:08 (2116): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... 06:59:22 (5592): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 06:59:23 (5592): No heartbeat from core client for 30 sec - exiting Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1552, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5416, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 11 received, exiting... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
27 May 2013 10:39:34	1211708	15651145	hadcm3n_n0bk_1880_40_008286947_1	777,600	1,477,255	1.8998
23 May 2013 13:59:53	1211708	15651145	hadcm3n_n0bk_1880_40_008286947_1	751,680	1,426,428	1.8977
19 May 2013 12:03:17	1211708	15651145	hadcm3n_n0bk_1880_40_008286947_1	725,760	1,375,324	1.8950
12 May 2013 20:21:54	1211708	15651145	hadcm3n_n0bk_1880_40_008286947_1	699,840	1,328,590	1.8984
09 May 2013 01:49:16	1211708	15651145	hadcm3n_n0bk_1880_40_008286947_1	673,920	1,281,647	1.9018
08 May 2013 11:59:59	1211708	15651145	hadcm3n_n0bk_1880_40_008286947_1	648,000	1,234,880	1.9057
07 May 2013 23:06:14	1211708	15651145	hadcm3n_n0bk_1880_40_008286947_1	622,080	1,188,055	1.9098
06 May 2013 20:57:46	1211708	15651145	hadcm3n_n0bk_1880_40_008286947_1	596,160	1,141,533	1.9148
04 May 2013 13:55:08	1211708	15651145	hadcm3n_n0bk_1880_40_008286947_1	570,240	1,095,597	1.9213
30 Apr 2013 14:15:22	1211708	15651145	hadcm3n_n0bk_1880_40_008286947_1	544,320	1,048,692	1.9266
30 Apr 2013 00:32:57	1211708	15651145	hadcm3n_n0bk_1880_40_008286947_1	518,400	1,001,523	1.9320
29 Apr 2013 11:03:28	1211708	15651145	hadcm3n_n0bk_1880_40_008286947_1	492,480	953,500	1.9361
27 Apr 2013 07:22:36	1211708	15651145	hadcm3n_n0bk_1880_40_008286947_1	466,560	905,687	1.9412
26 Apr 2013 19:05:43	1211708	15651145	hadcm3n_n0bk_1880_40_008286947_1	440,640	859,955	1.9516
24 Apr 2013 20:21:46	1211708	15651145	hadcm3n_n0bk_1880_40_008286947_1	414,720	812,506	1.9592
18 Apr 2013 11:17:10	1211708	15651145	hadcm3n_n0bk_1880_40_008286947_1	388,800	764,381	1.9660
10 Apr 2013 05:01:51	1211708	15651145	hadcm3n_n0bk_1880_40_008286947_1	362,880	713,007	1.9649
09 Apr 2013 09:05:05	1211708	15651145	hadcm3n_n0bk_1880_40_008286947_1	336,960	663,122	1.9680
06 Apr 2013 10:24:13	1211708	15651145	hadcm3n_n0bk_1880_40_008286947_1	311,040	612,481	1.9691
05 Apr 2013 12:26:21	1211708	15651145	hadcm3n_n0bk_1880_40_008286947_1	285,120	564,041	1.9783