Task 15597853

Name	hadcm3n_3a08_1940_40_008257614_3
Workunit	8412738
Created	8 Feb 2013, 1:11:26 UTC
Sent	8 Feb 2013, 1:20:48 UTC
Report deadline	10 May 2013, 8:47:59 UTC
Received	18 Apr 2013, 12:59:59 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1266469
Run time	15 days 20 hours 33 min 6 sec
CPU time	15 days 1 hours 53 min 46 sec
Validate state	Invalid
Credit	8,087.04
Device peak FLOPS	2.47 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6844, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... 17:24:31 (1896): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6208, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 00:08:46 (8352): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7784, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7784, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7784, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7784, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7784, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7784, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
17 Apr 2013 15:45:46	1266469	15597853	hadcm3n_3a08_1940_40_008257614_3	673,920	1,286,222	1.9086
17 Apr 2013 00:54:13	1266469	15597853	hadcm3n_3a08_1940_40_008257614_3	648,000	1,236,302	1.9079
16 Apr 2013 09:44:59	1266469	15597853	hadcm3n_3a08_1940_40_008257614_3	622,080	1,184,913	1.9048
10 Apr 2013 08:48:16	1266469	15597853	hadcm3n_3a08_1940_40_008257614_3	596,160	1,131,870	1.8986
09 Apr 2013 12:51:30	1266469	15597853	hadcm3n_3a08_1940_40_008257614_3	570,240	1,080,313	1.8945
07 Apr 2013 11:08:40	1266469	15597853	hadcm3n_3a08_1940_40_008257614_3	544,320	1,032,222	1.8964
03 Apr 2013 06:59:46	1266469	15597853	hadcm3n_3a08_1940_40_008257614_3	518,400	983,700	1.8976
29 Mar 2013 02:12:26	1266469	15597853	hadcm3n_3a08_1940_40_008257614_3	492,480	936,020	1.9006
28 Mar 2013 06:48:03	1266469	15597853	hadcm3n_3a08_1940_40_008257614_3	466,560	887,908	1.9031
27 Mar 2013 12:13:42	1266469	15597853	hadcm3n_3a08_1940_40_008257614_3	440,640	837,608	1.9009
21 Mar 2013 02:32:36	1266469	15597853	hadcm3n_3a08_1940_40_008257614_3	414,720	788,316	1.9008
20 Mar 2013 09:47:16	1266469	15597853	hadcm3n_3a08_1940_40_008257614_3	388,800	740,064	1.9035
19 Mar 2013 10:19:27	1266469	15597853	hadcm3n_3a08_1940_40_008257614_3	362,880	689,910	1.9012
16 Mar 2013 14:00:23	1266469	15597853	hadcm3n_3a08_1940_40_008257614_3	336,960	640,245	1.9001
15 Mar 2013 23:29:42	1266469	15597853	hadcm3n_3a08_1940_40_008257614_3	311,040	589,528	1.8953
05 Mar 2013 07:10:27	1266469	15597853	hadcm3n_3a08_1940_40_008257614_3	285,120	539,952	1.8938
04 Mar 2013 15:40:41	1266469	15597853	hadcm3n_3a08_1940_40_008257614_3	259,200	489,179	1.8873
04 Mar 2013 00:35:58	1266469	15597853	hadcm3n_3a08_1940_40_008257614_3	233,280	439,559	1.8843
03 Mar 2013 10:51:20	1266469	15597853	hadcm3n_3a08_1940_40_008257614_3	207,360	390,938	1.8853
02 Mar 2013 20:15:19	1266469	15597853	hadcm3n_3a08_1940_40_008257614_3	181,440	340,757	1.8781