Task 13023010

Name	hadcm3n_t3as_1940_40_007315078_1
Workunit	7512508
Created	28 Jun 2011, 19:31:24 UTC
Sent	29 Jun 2011, 21:00:01 UTC
Report deadline	29 Sep 2011, 4:27:12 UTC
Received	15 Jul 2011, 14:13:05 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1147697
Run time	13 days 10 hours 14 min 14 sec
CPU time	13 days 6 hours 30 min 20 sec
Validate state	Invalid
Credit	8,398.08
Device peak FLOPS	3.20 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.58</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 10:23:30 (4828): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2448, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2448, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2448, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2448, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2448, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... 11:32:12 (3532): No heartbeat from core client for 30 sec - exiting 11:32:13 (3532): No heartbeat from core client for 30 sec - exiting 11:32:14 (3532): No heartbeat from core client for 30 sec - exiting 11:32:16 (3532): No heartbeat from core client for 30 sec - exiting 11:32:17 (3532): No heartbeat from core client for 30 sec - exiting 11:32:18 (3532): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4608, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
25 Jul 2011 12:37:12	1147697	13023010	hadcm3n_t3as_1940_40_007315078_1	699,840	1,116,677	1.5956
25 Jul 2011 12:37:11	1147697	13023010	hadcm3n_t3as_1940_40_007315078_1	673,920	1,074,049	1.5937
25 Jul 2011 12:37:11	1147697	13023010	hadcm3n_t3as_1940_40_007315078_1	648,000	1,031,800	1.5923
25 Jul 2011 12:37:11	1147697	13023010	hadcm3n_t3as_1940_40_007315078_1	622,080	989,183	1.5901
10 Jul 2011 23:50:12	1147697	13023010	hadcm3n_t3as_1940_40_007315078_1	596,160	947,107	1.5887
10 Jul 2011 11:22:52	1147697	13023010	hadcm3n_t3as_1940_40_007315078_1	570,240	904,652	1.5864
09 Jul 2011 23:33:06	1147697	13023010	hadcm3n_t3as_1940_40_007315078_1	544,320	862,446	1.5844
09 Jul 2011 11:31:15	1147697	13023010	hadcm3n_t3as_1940_40_007315078_1	518,400	819,855	1.5815
08 Jul 2011 23:41:00	1147697	13023010	hadcm3n_t3as_1940_40_007315078_1	492,480	777,692	1.5791
08 Jul 2011 14:45:23	1147697	13023010	hadcm3n_t3as_1940_40_007315078_1	466,560	735,284	1.5760
07 Jul 2011 23:55:38	1147697	13023010	hadcm3n_t3as_1940_40_007315078_1	440,640	693,119	1.5730
07 Jul 2011 18:20:53	1147697	13023010	hadcm3n_t3as_1940_40_007315078_1	414,720	651,771	1.5716
07 Jul 2011 18:20:53	1147697	13023010	hadcm3n_t3as_1940_40_007315078_1	388,800	610,744	1.5708
07 Jul 2011 18:20:53	1147697	13023010	hadcm3n_t3as_1940_40_007315078_1	362,880	569,491	1.5694
06 Jul 2011 01:38:16	1147697	13023010	hadcm3n_t3as_1940_40_007315078_1	336,960	528,436	1.5682
05 Jul 2011 13:36:08	1147697	13023010	hadcm3n_t3as_1940_40_007315078_1	311,040	486,592	1.5644
05 Jul 2011 02:05:55	1147697	13023010	hadcm3n_t3as_1940_40_007315078_1	285,120	445,574	1.5628
04 Jul 2011 14:27:27	1147697	13023010	hadcm3n_t3as_1940_40_007315078_1	259,200	404,531	1.5607
04 Jul 2011 02:53:52	1147697	13023010	hadcm3n_t3as_1940_40_007315078_1	233,280	363,481	1.5581
03 Jul 2011 15:32:55	1147697	13023010	hadcm3n_t3as_1940_40_007315078_1	207,360	322,928	1.5573