Task 14570159

Name	hadcm3n_o6ll_2020_40_007857467_4
Workunit	8012579
Created	23 Apr 2012, 6:30:39 UTC
Sent	23 Apr 2012, 6:30:44 UTC
Report deadline	23 Jul 2012, 13:57:55 UTC
Received	13 May 2012, 4:13:20 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1204416
Run time	15 days 11 hours 27 min 19 sec
CPU time	12 days 3 hours 32 min 46 sec
Validate state	Invalid
Credit	5,287.68
Device peak FLOPS	1.85 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.25</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 18:00:38 (3436): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 02:35:11 (4724): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 02:41:16 (2724): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2892, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1120, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1120, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1120, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3900, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3900, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
12 May 2012 02:58:50	1204416	14570159	hadcm3n_o6ll_2020_40_007857467_4	440,640	996,982	2.2626
11 May 2012 06:19:01	1204416	14570159	hadcm3n_o6ll_2020_40_007857467_4	414,720	941,936	2.2713
10 May 2012 07:43:47	1204416	14570159	hadcm3n_o6ll_2020_40_007857467_4	388,800	883,141	2.2715
09 May 2012 07:53:24	1204416	14570159	hadcm3n_o6ll_2020_40_007857467_4	362,880	822,795	2.2674
08 May 2012 04:07:16	1204416	14570159	hadcm3n_o6ll_2020_40_007857467_4	336,960	761,795	2.2608
07 May 2012 03:46:32	1204416	14570159	hadcm3n_o6ll_2020_40_007857467_4	311,040	701,177	2.2543
06 May 2012 03:42:33	1204416	14570159	hadcm3n_o6ll_2020_40_007857467_4	285,120	640,414	2.2461
05 May 2012 04:07:30	1204416	14570159	hadcm3n_o6ll_2020_40_007857467_4	259,200	579,991	2.2376
04 May 2012 04:55:42	1204416	14570159	hadcm3n_o6ll_2020_40_007857467_4	233,280	521,035	2.2335
01 May 2012 17:09:01	1204416	14570159	hadcm3n_o6ll_2020_40_007857467_4	207,360	464,457	2.2399
30 Apr 2012 15:14:36	1204416	14570159	hadcm3n_o6ll_2020_40_007857467_4	181,440	406,407	2.2399
29 Apr 2012 18:31:27	1204416	14570159	hadcm3n_o6ll_2020_40_007857467_4	155,520	347,797	2.2363
29 Apr 2012 01:22:17	1204416	14570159	hadcm3n_o6ll_2020_40_007857467_4	129,600	291,580	2.2498
28 Apr 2012 05:42:44	1204416	14570159	hadcm3n_o6ll_2020_40_007857467_4	103,680	235,265	2.2691
27 Apr 2012 12:26:54	1204416	14570159	hadcm3n_o6ll_2020_40_007857467_4	77,760	176,396	2.2685
26 Apr 2012 19:12:49	1204416	14570159	hadcm3n_o6ll_2020_40_007857467_4	51,840	117,666	2.2698
26 Apr 2012 01:52:13	1204416	14570159	hadcm3n_o6ll_2020_40_007857467_4	25,920	58,750	2.2666