Task 15448288

Name	hadcm3n_zb8m_1880_40_008248648_2
Workunit	8403772
Created	21 Nov 2012, 19:54:00 UTC
Sent	21 Nov 2012, 19:54:05 UTC
Report deadline	21 Feb 2013, 3:21:16 UTC
Received	18 Dec 2012, 5:23:09 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1224263
Run time	8 days 7 hours 37 min 41 sec
CPU time	7 days 16 hours 43 min 10 sec
Validate state	Invalid
Credit	7,153.92
Device peak FLOPS	3.52 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 05:41:00 (4404): No heartbeat from core client for 30 sec - exiting 05:41:01 (4404): No heartbeat from core client for 30 sec - exiting 05:41:02 (4404): No heartbeat from core client for 30 sec - exiting 05:41:03 (4404): No heartbeat from core client for 30 sec - exiting 05:41:04 (4404): No heartbeat from core client for 30 sec - exiting 05:41:05 (4404): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 05:42:04 (944): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 06:25:07 (4520): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 07:27:36 (5172): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 07:28:50 (3708): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 07:28:51 (3708): No heartbeat from core client for 30 sec - exiting 07:30:39 (5008): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Atmos Hold Restart file rename failed on atmos_restart.hold Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... 06:02:29 (2992): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 12:03:38 (7124): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 12:06:43 (2456): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 12:07:24 (4460): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 12:08:27 (6672): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3456, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3456, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3456, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3456, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3456, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3456, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
17 Dec 2012 01:43:28	1224263	15448288	hadcm3n_zb8m_1880_40_008248648_2	596,160	638,158	1.0704
15 Dec 2012 19:55:19	1224263	15448288	hadcm3n_zb8m_1880_40_008248648_2	570,240	610,575	1.0707
13 Dec 2012 20:41:05	1224263	15448288	hadcm3n_zb8m_1880_40_008248648_2	544,320	582,983	1.0710
13 Dec 2012 20:41:05	1224263	15448288	hadcm3n_zb8m_1880_40_008248648_2	518,400	555,437	1.0714
13 Dec 2012 20:41:05	1224263	15448288	hadcm3n_zb8m_1880_40_008248648_2	492,480	527,631	1.0714
08 Dec 2012 05:00:30	1224263	15448288	hadcm3n_zb8m_1880_40_008248648_2	466,560	499,595	1.0708
07 Dec 2012 19:57:00	1224263	15448288	hadcm3n_zb8m_1880_40_008248648_2	440,640	471,407	1.0698
07 Dec 2012 09:12:01	1224263	15448288	hadcm3n_zb8m_1880_40_008248648_2	414,720	443,672	1.0698
06 Dec 2012 22:55:16	1224263	15448288	hadcm3n_zb8m_1880_40_008248648_2	388,800	416,046	1.0701
06 Dec 2012 10:18:38	1224263	15448288	hadcm3n_zb8m_1880_40_008248648_2	362,880	388,548	1.0707
04 Dec 2012 03:15:59	1224263	15448288	hadcm3n_zb8m_1880_40_008248648_2	336,960	360,791	1.0707
03 Dec 2012 19:42:08	1224263	15448288	hadcm3n_zb8m_1880_40_008248648_2	311,040	332,706	1.0697
01 Dec 2012 17:50:26	1224263	15448288	hadcm3n_zb8m_1880_40_008248648_2	285,120	304,118	1.0666
01 Dec 2012 09:46:28	1224263	15448288	hadcm3n_zb8m_1880_40_008248648_2	259,200	276,539	1.0669
01 Dec 2012 02:19:45	1224263	15448288	hadcm3n_zb8m_1880_40_008248648_2	233,280	249,765	1.0707
30 Nov 2012 15:09:07	1224263	15448288	hadcm3n_zb8m_1880_40_008248648_2	207,360	222,034	1.0708
30 Nov 2012 06:36:23	1224263	15448288	hadcm3n_zb8m_1880_40_008248648_2	181,440	193,884	1.0686
29 Nov 2012 22:09:21	1224263	15448288	hadcm3n_zb8m_1880_40_008248648_2	155,520	165,632	1.0650
29 Nov 2012 03:51:32	1224263	15448288	hadcm3n_zb8m_1880_40_008248648_2	129,600	137,072	1.0577
28 Nov 2012 03:05:26	1224263	15448288	hadcm3n_zb8m_1880_40_008248648_2	103,680	109,312	1.0543