Task 15857601

Name	hadcm3n_4d9c_2020_40_008335799_1
Workunit	8486660
Created	22 Jun 2013, 10:28:47 UTC
Sent	23 Jun 2013, 1:19:25 UTC
Report deadline	22 Sep 2013, 8:46:36 UTC
Received	14 Aug 2013, 17:16:01 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1166924
Run time	3 days 13 hours 15 min 43 sec
CPU time	3 days 13 hours 6 min 43 sec
Validate state	Invalid
Credit	3,732.48
Device peak FLOPS	2.93 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 23:07:08 (2812): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 23:40:58 (3704): No heartbeat from core client for 30 sec - exiting 23:40:59 (3704): No heartbeat from core client for 30 sec - exiting 23:41:00 (3704): No heartbeat from core client for 30 sec - exiting 23:41:02 (3704): No heartbeat from core client for 30 sec - exiting 23:41:03 (3704): No heartbeat from core client for 30 sec - exiting 23:41:04 (3704): No heartbeat from core client for 30 sec - exiting 23:41:05 (3704): No heartbeat from core client for 30 sec - exiting 23:41:06 (3704): No heartbeat from core client for 30 sec - exiting 23:41:07 (3704): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2128, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2128, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2128, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2128, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2128, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2128, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
14 Aug 2013 17:20:58	1166924	15857601	hadcm3n_4d9c_2020_40_008335799_1	311,040	285,053	0.9165
14 Aug 2013 17:20:58	1166924	15857601	hadcm3n_4d9c_2020_40_008335799_1	285,120	263,268	0.9234
14 Aug 2013 17:20:58	1166924	15857601	hadcm3n_4d9c_2020_40_008335799_1	259,200	241,151	0.9304
14 Aug 2013 17:20:58	1166924	15857601	hadcm3n_4d9c_2020_40_008335799_1	233,280	218,820	0.9380
14 Aug 2013 17:20:58	1166924	15857601	hadcm3n_4d9c_2020_40_008335799_1	207,360	194,140	0.9362
25 Jun 2013 00:57:37	1166924	15857601	hadcm3n_4d9c_2020_40_008335799_1	181,440	169,347	0.9333
24 Jun 2013 17:51:45	1166924	15857601	hadcm3n_4d9c_2020_40_008335799_1	155,520	144,039	0.9262
24 Jun 2013 11:06:00	1166924	15857601	hadcm3n_4d9c_2020_40_008335799_1	129,600	119,687	0.9235
24 Jun 2013 03:57:49	1166924	15857601	hadcm3n_4d9c_2020_40_008335799_1	103,680	95,174	0.9180
23 Jun 2013 21:18:22	1166924	15857601	hadcm3n_4d9c_2020_40_008335799_1	77,760	71,475	0.9192
23 Jun 2013 14:44:18	1166924	15857601	hadcm3n_4d9c_2020_40_008335799_1	51,840	47,745	0.9210
23 Jun 2013 08:06:24	1166924	15857601	hadcm3n_4d9c_2020_40_008335799_1	25,920	23,882	0.9214