Task 14848124

Name	hadcm3n_zl3k_1880_40_008026426_0
Workunit	8181540
Created	29 Jun 2012, 16:54:30 UTC
Sent	29 Jun 2012, 16:54:47 UTC
Report deadline	29 Sep 2012, 0:21:58 UTC
Received	13 Jul 2012, 13:11:13 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1179998
Run time	9 days 22 hours 11 min 5 sec
CPU time	9 days 0 hours 31 min 30 sec
Validate state	Invalid
Credit	6,220.80
Device peak FLOPS	2.80 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 10:06:27 (1992): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=836, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish 14:20:51 (836): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5764, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5764, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5764, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5764, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5764, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
13 Jul 2012 06:04:01	1179998	14848124	hadcm3n_zl3k_1880_40_008026426_0	518,400	768,782	1.4830
12 Jul 2012 12:32:32	1179998	14848124	hadcm3n_zl3k_1880_40_008026426_0	492,480	730,145	1.4826
11 Jul 2012 13:44:44	1179998	14848124	hadcm3n_zl3k_1880_40_008026426_0	466,560	691,407	1.4819
10 Jul 2012 23:36:31	1179998	14848124	hadcm3n_zl3k_1880_40_008026426_0	440,640	648,832	1.4725
10 Jul 2012 07:50:13	1179998	14848124	hadcm3n_zl3k_1880_40_008026426_0	414,720	610,083	1.4711
09 Jul 2012 15:26:05	1179998	14848124	hadcm3n_zl3k_1880_40_008026426_0	388,800	571,760	1.4706
08 Jul 2012 20:22:15	1179998	14848124	hadcm3n_zl3k_1880_40_008026426_0	362,880	533,185	1.4693
08 Jul 2012 04:14:10	1179998	14848124	hadcm3n_zl3k_1880_40_008026426_0	336,960	494,218	1.4667
07 Jul 2012 10:35:37	1179998	14848124	hadcm3n_zl3k_1880_40_008026426_0	311,040	456,722	1.4684
06 Jul 2012 18:09:59	1179998	14848124	hadcm3n_zl3k_1880_40_008026426_0	285,120	419,210	1.4703
06 Jul 2012 01:22:53	1179998	14848124	hadcm3n_zl3k_1880_40_008026426_0	259,200	380,782	1.4691
05 Jul 2012 09:33:36	1179998	14848124	hadcm3n_zl3k_1880_40_008026426_0	233,280	343,223	1.4713
04 Jul 2012 17:25:19	1179998	14848124	hadcm3n_zl3k_1880_40_008026426_0	207,360	304,551	1.4687
04 Jul 2012 04:05:58	1179998	14848124	hadcm3n_zl3k_1880_40_008026426_0	181,440	266,027	1.4662
02 Jul 2012 17:52:54	1179998	14848124	hadcm3n_zl3k_1880_40_008026426_0	155,520	230,269	1.4806
02 Jul 2012 12:00:55	1179998	14848124	hadcm3n_zl3k_1880_40_008026426_0	129,600	190,178	1.4674
02 Jul 2012 12:00:55	1179998	14848124	hadcm3n_zl3k_1880_40_008026426_0	103,680	152,223	1.4682
02 Jul 2012 12:00:55	1179998	14848124	hadcm3n_zl3k_1880_40_008026426_0	77,760	114,727	1.4754
02 Jul 2012 12:00:55	1179998	14848124	hadcm3n_zl3k_1880_40_008026426_0	51,840	76,594	1.4775
30 Jun 2012 04:43:36	1179998	14848124	hadcm3n_zl3k_1880_40_008026426_0	25,920	38,445	1.4832