Task 15462469

Name	hadcm3n_zcsj_1880_40_008253805_2
Workunit	8408929
Created	26 Nov 2012, 13:57:12 UTC
Sent	26 Nov 2012, 13:58:27 UTC
Report deadline	25 Feb 2013, 21:25:38 UTC
Received	16 Feb 2013, 16:34:07 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1212761
Run time	9 days 8 hours 55 min 24 sec
CPU time	8 days 16 hours 13 min 49 sec
Validate state	Invalid
Credit	5,287.68
Device peak FLOPS	3.05 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 11:31:16 (5976): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5744, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5744, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5744, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5744, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5744, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5744, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
16 Feb 2013 06:53:33	1212761	15462469	hadcm3n_zcsj_1880_40_008253805_2	440,640	718,789	1.6312
15 Feb 2013 12:02:46	1212761	15462469	hadcm3n_zcsj_1880_40_008253805_2	414,720	676,984	1.6324
14 Feb 2013 13:40:17	1212761	15462469	hadcm3n_zcsj_1880_40_008253805_2	388,800	635,375	1.6342
13 Jan 2013 17:56:06	1212761	15462469	hadcm3n_zcsj_1880_40_008253805_2	362,880	592,273	1.6321
13 Jan 2013 03:43:40	1212761	15462469	hadcm3n_zcsj_1880_40_008253805_2	336,960	547,969	1.6262
12 Jan 2013 14:20:22	1212761	15462469	hadcm3n_zcsj_1880_40_008253805_2	311,040	503,737	1.6195
12 Jan 2013 00:47:49	1212761	15462469	hadcm3n_zcsj_1880_40_008253805_2	285,120	459,433	1.6114
11 Jan 2013 12:25:05	1212761	15462469	hadcm3n_zcsj_1880_40_008253805_2	259,200	416,583	1.6072
10 Jan 2013 23:22:37	1212761	15462469	hadcm3n_zcsj_1880_40_008253805_2	233,280	374,809	1.6067
10 Jan 2013 10:59:02	1212761	15462469	hadcm3n_zcsj_1880_40_008253805_2	207,360	333,074	1.6063
09 Jan 2013 22:46:48	1212761	15462469	hadcm3n_zcsj_1880_40_008253805_2	181,440	291,823	1.6084
09 Jan 2013 10:30:29	1212761	15462469	hadcm3n_zcsj_1880_40_008253805_2	155,520	250,297	1.6094
08 Jan 2013 21:57:30	1212761	15462469	hadcm3n_zcsj_1880_40_008253805_2	129,600	208,742	1.6107
08 Jan 2013 09:42:13	1212761	15462469	hadcm3n_zcsj_1880_40_008253805_2	103,680	167,180	1.6125
07 Jan 2013 21:18:50	1212761	15462469	hadcm3n_zcsj_1880_40_008253805_2	77,760	125,381	1.6124
07 Jan 2013 09:01:00	1212761	15462469	hadcm3n_zcsj_1880_40_008253805_2	51,840	83,878	1.6180
06 Jan 2013 20:42:03	1212761	15462469	hadcm3n_zcsj_1880_40_008253805_2	25,920	42,241	1.6297