Task 15743568

Name	hadcm3n_yds4_2020_40_008335788_2
Workunit	8486649
Created	20 Apr 2013, 17:04:25 UTC
Sent	20 Apr 2013, 17:08:05 UTC
Report deadline	21 Jul 2013, 0:35:16 UTC
Received	3 May 2013, 18:15:38 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1216062
Run time	3 days 22 hours 7 min 7 sec
CPU time	3 days 16 hours 41 min 46 sec
Validate state	Invalid
Credit	2,799.36
Device peak FLOPS	2.46 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 19:28:08 (5136): No heartbeat from core client for 30 sec - exiting 19:28:10 (5136): No heartbeat from core client for 30 sec - exiting 19:28:11 (5136): No heartbeat from core client for 30 sec - exiting 19:28:12 (5136): No heartbeat from core client for 30 sec - exiting 19:28:13 (5136): No heartbeat from core client for 30 sec - exiting 19:28:14 (5136): No heartbeat from core client for 30 sec - exiting 19:28:15 (5136): No heartbeat from core client for 30 sec - exiting 19:28:16 (5136): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 19:28:17 (5136): No heartbeat from core client for 30 sec - exiting 19:28:18 (5136): No heartbeat from core client for 30 sec - exiting 19:28:19 (5136): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2848, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2848, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2848, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2848, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2848, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2848, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
03 May 2013 07:38:16	1216062	15743568	hadcm3n_yds4_2020_40_008335788_2	233,280	306,851	1.3154
02 May 2013 17:16:45	1216062	15743568	hadcm3n_yds4_2020_40_008335788_2	207,360	270,154	1.3028
02 May 2013 03:49:28	1216062	15743568	hadcm3n_yds4_2020_40_008335788_2	181,440	230,012	1.2677
30 Apr 2013 23:16:15	1216062	15743568	hadcm3n_yds4_2020_40_008335788_2	155,520	192,564	1.2382
28 Apr 2013 14:55:44	1216062	15743568	hadcm3n_yds4_2020_40_008335788_2	129,600	160,828	1.2410
26 Apr 2013 20:17:51	1216062	15743568	hadcm3n_yds4_2020_40_008335788_2	103,680	129,482	1.2489
26 Apr 2013 02:51:02	1216062	15743568	hadcm3n_yds4_2020_40_008335788_2	77,760	95,745	1.2313
25 Apr 2013 17:31:41	1216062	15743568	hadcm3n_yds4_2020_40_008335788_2	51,840	63,333	1.2217
25 Apr 2013 08:11:44	1216062	15743568	hadcm3n_yds4_2020_40_008335788_2	25,920	31,975	1.2336