Task 12836995

Name	hadcm3n_p6qn_1900_40_007226319_2
Workunit	7424559
Created	28 Apr 2011, 6:13:08 UTC
Sent	28 Apr 2011, 6:15:26 UTC
Report deadline	28 Jul 2011, 13:42:37 UTC
Received	16 May 2011, 20:21:25 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	193 (0x000000C1) EXIT_SIGNAL
Computer ID	827009
Run time	12 days 8 hours 38 min 4 sec
CPU time	10 days 13 hours 20 min 17 sec
Validate state	Invalid
Credit	6,220.80
Device peak FLOPS	2.24 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.58</core_client_version> <![CDATA[ <message> - exit code 193 (0xc1) </message> <stderr_txt> Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4004, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4688, iMonCtr=1 Model crash detected, will try to restart... 08:44:55 (4768): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4636, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... 07:19:33 (1448): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 04:10:34 (5788): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 04:10:35 (5788): No heartbeat from core client for 30 sec - exiting 04:10:36 (5788): No heartbeat from core client for 30 sec - exiting 04:10:37 (5788): No heartbeat from core client for 30 sec - exiting 04:10:38 (5788): No heartbeat from core client for 30 sec - exiting Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5888, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5468, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5580, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5580, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4424, iMonCtr=1 Model crash detected, will try to restart... 08:18:02 (5024): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6116, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
16 May 2011 20:23:27	827009	12836995	hadcm3n_p6qn_1900_40_007226319_2	518,400	912,014	1.7593
15 May 2011 19:55:10	827009	12836995	hadcm3n_p6qn_1900_40_007226319_2	492,480	865,574	1.7576
14 May 2011 21:04:41	827009	12836995	hadcm3n_p6qn_1900_40_007226319_2	466,560	819,871	1.7573
14 May 2011 07:53:43	827009	12836995	hadcm3n_p6qn_1900_40_007226319_2	440,640	775,178	1.7592
13 May 2011 07:18:08	827009	12836995	hadcm3n_p6qn_1900_40_007226319_2	414,720	728,878	1.7575
12 May 2011 14:42:08	827009	12836995	hadcm3n_p6qn_1900_40_007226319_2	388,800	682,281	1.7548
11 May 2011 14:14:26	827009	12836995	hadcm3n_p6qn_1900_40_007226319_2	362,880	635,887	1.7523
10 May 2011 06:14:16	827009	12836995	hadcm3n_p6qn_1900_40_007226319_2	336,960	590,085	1.7512
09 May 2011 16:03:26	827009	12836995	hadcm3n_p6qn_1900_40_007226319_2	311,040	543,995	1.7490
06 May 2011 11:22:33	827009	12836995	hadcm3n_p6qn_1900_40_007226319_2	285,120	497,883	1.7462
05 May 2011 21:02:16	827009	12836995	hadcm3n_p6qn_1900_40_007226319_2	259,200	451,948	1.7436
05 May 2011 05:49:22	827009	12836995	hadcm3n_p6qn_1900_40_007226319_2	233,280	405,738	1.7393
04 May 2011 06:26:09	827009	12836995	hadcm3n_p6qn_1900_40_007226319_2	207,360	360,363	1.7379
03 May 2011 06:57:38	827009	12836995	hadcm3n_p6qn_1900_40_007226319_2	181,440	314,654	1.7342
02 May 2011 17:58:07	827009	12836995	hadcm3n_p6qn_1900_40_007226319_2	155,520	269,509	1.7330
01 May 2011 18:25:07	827009	12836995	hadcm3n_p6qn_1900_40_007226319_2	129,600	224,007	1.7284
01 May 2011 05:46:11	827009	12836995	hadcm3n_p6qn_1900_40_007226319_2	103,680	179,919	1.7353
30 Apr 2011 17:27:40	827009	12836995	hadcm3n_p6qn_1900_40_007226319_2	77,760	135,959	1.7484
29 Apr 2011 11:34:52	827009	12836995	hadcm3n_p6qn_1900_40_007226319_2	51,840	91,069	1.7567
28 Apr 2011 21:59:20	827009	12836995	hadcm3n_p6qn_1900_40_007226319_2	25,920	45,974	1.7737