Task 15727571

Name	hadcm3n_4jfj_1940_40_008306366_3
Workunit	8457501
Created	17 Apr 2013, 6:22:14 UTC
Sent	17 Apr 2013, 6:22:23 UTC
Report deadline	17 Jul 2013, 13:49:34 UTC
Received	29 Apr 2013, 22:06:26 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1254613
Run time	10 days 21 hours 22 min 11 sec
CPU time	10 days 12 hours 13 min 21 sec
Validate state	Invalid
Credit	7,464.96
Device peak FLOPS	2.62 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> 01:00:08 (2124): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4472, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4472, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4472, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4472, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4472, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4472, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
27 Apr 2013 20:26:25	1254613	15727571	hadcm3n_4jfj_1940_40_008306366_3	622,080	892,832	1.4352
27 Apr 2013 10:08:22	1254613	15727571	hadcm3n_4jfj_1940_40_008306366_3	596,160	857,204	1.4379
26 Apr 2013 23:50:00	1254613	15727571	hadcm3n_4jfj_1940_40_008306366_3	570,240	821,620	1.4408
26 Apr 2013 13:19:23	1254613	15727571	hadcm3n_4jfj_1940_40_008306366_3	544,320	785,301	1.4427
26 Apr 2013 02:56:03	1254613	15727571	hadcm3n_4jfj_1940_40_008306366_3	518,400	749,528	1.4458
25 Apr 2013 16:26:08	1254613	15727571	hadcm3n_4jfj_1940_40_008306366_3	492,480	713,261	1.4483
25 Apr 2013 05:51:05	1254613	15727571	hadcm3n_4jfj_1940_40_008306366_3	466,560	676,800	1.4506
24 Apr 2013 19:20:30	1254613	15727571	hadcm3n_4jfj_1940_40_008306366_3	440,640	640,305	1.4531
24 Apr 2013 09:05:12	1254613	15727571	hadcm3n_4jfj_1940_40_008306366_3	414,720	604,094	1.4566
23 Apr 2013 23:21:58	1254613	15727571	hadcm3n_4jfj_1940_40_008306366_3	388,800	569,577	1.4650
23 Apr 2013 13:05:30	1254613	15727571	hadcm3n_4jfj_1940_40_008306366_3	362,880	533,067	1.4690
23 Apr 2013 03:02:10	1254613	15727571	hadcm3n_4jfj_1940_40_008306366_3	336,960	497,016	1.4750
22 Apr 2013 16:05:59	1254613	15727571	hadcm3n_4jfj_1940_40_008306366_3	311,040	458,427	1.4739
22 Apr 2013 03:32:01	1254613	15727571	hadcm3n_4jfj_1940_40_008306366_3	285,120	414,206	1.4527
21 Apr 2013 15:10:31	1254613	15727571	hadcm3n_4jfj_1940_40_008306366_3	259,200	370,658	1.4300
21 Apr 2013 03:45:40	1254613	15727571	hadcm3n_4jfj_1940_40_008306366_3	233,280	330,140	1.4152
20 Apr 2013 17:07:44	1254613	15727571	hadcm3n_4jfj_1940_40_008306366_3	207,360	292,693	1.4115
20 Apr 2013 06:28:07	1254613	15727571	hadcm3n_4jfj_1940_40_008306366_3	181,440	254,777	1.4042
19 Apr 2013 19:53:13	1254613	15727571	hadcm3n_4jfj_1940_40_008306366_3	155,520	217,499	1.3985
19 Apr 2013 09:23:54	1254613	15727571	hadcm3n_4jfj_1940_40_008306366_3	129,600	180,380	1.3918