Task 13128859

Name	hadcm3n_ymv7_1900_40_007362493_0
Workunit	7559923
Created	6 Jul 2011, 15:26:02 UTC
Sent	6 Jul 2011, 18:23:46 UTC
Report deadline	6 Oct 2011, 1:50:57 UTC
Received	27 Jul 2011, 18:25:49 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1106706
Run time	9 days 12 hours 18 min 59 sec
CPU time	8 days 9 hours 23 min 23 sec
Validate state	Invalid
Credit	5,909.76
Device peak FLOPS	2.87 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.58</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> 14:28:31 (6572): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 18:28:49 (1156): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 13:33:59 (6324): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 17:34:25 (5400): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 15:46:59 (9840): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5444, iMonCtr=1 Model crash detected, will try to restart... 13:14:55 (5912): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4312, iMonCtr=1 Model crash detected, will try to restart... 09:42:58 (7544): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 17:42:39 (4776): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 14:42:21 (3876): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6256, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4252, iMonCtr=1 Model crash detected, will try to restart... 13:41:15 (6172): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 17:41:33 (8492): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 09:47:41 (7336): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 16:14:45 (2928): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 15:14:10 (9468): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
27 Jul 2011 16:25:38	1106706	13128859	hadcm3n_ymv7_1900_40_007362493_0	492,480	757,471	1.5381
27 Jul 2011 07:29:58	1106706	13128859	hadcm3n_ymv7_1900_40_007362493_0	466,560	725,740	1.5555
26 Jul 2011 22:20:28	1106706	13128859	hadcm3n_ymv7_1900_40_007362493_0	440,640	693,336	1.5735
26 Jul 2011 15:29:12	1106706	13128859	hadcm3n_ymv7_1900_40_007362493_0	414,720	661,474	1.5950
26 Jul 2011 04:24:11	1106706	13128859	hadcm3n_ymv7_1900_40_007362493_0	388,800	629,517	1.6191
25 Jul 2011 23:16:14	1106706	13128859	hadcm3n_ymv7_1900_40_007362493_0	362,880	596,772	1.6445
25 Jul 2011 22:28:41	1106706	13128859	hadcm3n_ymv7_1900_40_007362493_0	336,960	563,959	1.6737
25 Jul 2011 22:28:41	1106706	13128859	hadcm3n_ymv7_1900_40_007362493_0	311,040	532,224	1.7111
25 Jul 2011 22:28:41	1106706	13128859	hadcm3n_ymv7_1900_40_007362493_0	285,120	500,974	1.7571
25 Jul 2011 22:28:29	1106706	13128859	hadcm3n_ymv7_1900_40_007362493_0	259,200	469,320	1.8106
25 Jul 2011 18:47:52	1106706	13128859	hadcm3n_ymv7_1900_40_007362493_0	233,280	437,270	1.8744
25 Jul 2011 17:40:35	1106706	13128859	hadcm3n_ymv7_1900_40_007362493_0	207,360	391,805	1.8895
25 Jul 2011 17:16:41	1106706	13128859	hadcm3n_ymv7_1900_40_007362493_0	181,440	343,980	1.8958
25 Jul 2011 16:40:53	1106706	13128859	hadcm3n_ymv7_1900_40_007362493_0	155,520	295,242	1.8984
25 Jul 2011 16:40:53	1106706	13128859	hadcm3n_ymv7_1900_40_007362493_0	129,600	246,533	1.9023
25 Jul 2011 16:40:53	1106706	13128859	hadcm3n_ymv7_1900_40_007362493_0	103,680	197,580	1.9057
25 Jul 2011 16:40:53	1106706	13128859	hadcm3n_ymv7_1900_40_007362493_0	77,760	147,619	1.8984
08 Jul 2011 04:22:07	1106706	13128859	hadcm3n_ymv7_1900_40_007362493_0	51,840	98,434	1.8988
07 Jul 2011 16:15:12	1106706	13128859	hadcm3n_ymv7_1900_40_007362493_0	25,920	49,135	1.8956