Task 13659030

Name	hadcm3n_o1ut_1980_40_007536675_2
Workunit	7733907
Created	24 Nov 2011, 14:43:45 UTC
Sent	24 Nov 2011, 14:48:24 UTC
Report deadline	23 Feb 2012, 22:15:35 UTC
Received	22 Dec 2011, 7:11:53 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1138140
Run time	5 days 20 hours 25 min 9 sec
CPU time	5 days 19 hours 39 min 57 sec
Validate state	Invalid
Credit	3,110.40
Device peak FLOPS	2.69 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.12.34</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 15:32:26 (10252): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3900, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3900, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5704, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5704, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5704, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5704, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
21 Dec 2011 06:57:27	1138140	13659030	hadcm3n_o1ut_1980_40_007536675_2	259,200	473,920	1.8284
02 Dec 2011 08:21:54	1138140	13659030	hadcm3n_o1ut_1980_40_007536675_2	233,280	427,842	1.8340
01 Dec 2011 11:42:10	1138140	13659030	hadcm3n_o1ut_1980_40_007536675_2	207,360	380,341	1.8342
30 Nov 2011 20:20:42	1138140	13659030	hadcm3n_o1ut_1980_40_007536675_2	181,440	332,809	1.8343
30 Nov 2011 03:34:57	1138140	13659030	hadcm3n_o1ut_1980_40_007536675_2	155,520	284,988	1.8325
29 Nov 2011 11:36:10	1138140	13659030	hadcm3n_o1ut_1980_40_007536675_2	129,600	237,076	1.8293
28 Nov 2011 18:13:18	1138140	13659030	hadcm3n_o1ut_1980_40_007536675_2	103,680	189,427	1.8270
27 Nov 2011 15:12:24	1138140	13659030	hadcm3n_o1ut_1980_40_007536675_2	77,760	141,858	1.8243
26 Nov 2011 10:29:59	1138140	13659030	hadcm3n_o1ut_1980_40_007536675_2	51,840	94,013	1.8135
25 Nov 2011 08:05:49	1138140	13659030	hadcm3n_o1ut_1980_40_007536675_2	25,920	46,392	1.7898