Task 13286746

Name	hadcm3n_p12w_1940_40_007419614_0
Workunit	7617249
Created	24 Aug 2011, 18:41:37 UTC
Sent	24 Aug 2011, 18:41:49 UTC
Report deadline	24 Nov 2011, 2:09:00 UTC
Received	13 Sep 2011, 23:56:02 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1081157
Run time	15 days 18 hours 6 min 20 sec
CPU time	15 days 15 hours 8 min 31 sec
Validate state	Invalid
Credit	8,087.04
Device peak FLOPS	2.67 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.56</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 22:44:34 (3552): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6216, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6216, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6216, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6216, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6216, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6216, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
13 Sep 2011 19:55:50	1081157	13286746	hadcm3n_p12w_1940_40_007419614_0	673,920	1,340,162	1.9886
13 Sep 2011 06:50:46	1081157	13286746	hadcm3n_p12w_1940_40_007419614_0	648,000	1,290,345	1.9913
12 Sep 2011 11:03:30	1081157	13286746	hadcm3n_p12w_1940_40_007419614_0	622,080	1,240,663	1.9944
11 Sep 2011 07:50:31	1081157	13286746	hadcm3n_p12w_1940_40_007419614_0	596,160	1,189,655	1.9955
10 Sep 2011 16:58:49	1081157	13286746	hadcm3n_p12w_1940_40_007419614_0	570,240	1,136,493	1.9930
10 Sep 2011 02:31:16	1081157	13286746	hadcm3n_p12w_1940_40_007419614_0	544,320	1,083,417	1.9904
09 Sep 2011 10:51:50	1081157	13286746	hadcm3n_p12w_1940_40_007419614_0	518,400	1,029,347	1.9856
08 Sep 2011 19:52:11	1081157	13286746	hadcm3n_p12w_1940_40_007419614_0	492,480	975,473	1.9807
08 Sep 2011 04:22:02	1081157	13286746	hadcm3n_p12w_1940_40_007419614_0	466,560	923,195	1.9787
07 Sep 2011 14:44:33	1081157	13286746	hadcm3n_p12w_1940_40_007419614_0	440,640	871,603	1.9780
06 Sep 2011 19:33:34	1081157	13286746	hadcm3n_p12w_1940_40_007419614_0	414,720	820,198	1.9777
06 Sep 2011 06:26:03	1081157	13286746	hadcm3n_p12w_1940_40_007419614_0	388,800	769,934	1.9803
05 Sep 2011 11:56:39	1081157	13286746	hadcm3n_p12w_1940_40_007419614_0	362,880	718,425	1.9798
04 Sep 2011 21:10:03	1081157	13286746	hadcm3n_p12w_1940_40_007419614_0	336,960	665,843	1.9760
04 Sep 2011 07:12:52	1081157	13286746	hadcm3n_p12w_1940_40_007419614_0	311,040	615,793	1.9798
02 Sep 2011 21:48:36	1081157	13286746	hadcm3n_p12w_1940_40_007419614_0	285,120	565,539	1.9835
01 Sep 2011 09:20:11	1081157	13286746	hadcm3n_p12w_1940_40_007419614_0	259,200	515,541	1.9890
31 Aug 2011 03:59:08	1081157	13286746	hadcm3n_p12w_1940_40_007419614_0	233,280	466,164	1.9983
30 Aug 2011 08:31:31	1081157	13286746	hadcm3n_p12w_1940_40_007419614_0	207,360	414,513	1.9990
29 Aug 2011 18:25:36	1081157	13286746	hadcm3n_p12w_1940_40_007419614_0	181,440	365,898	2.0166