Task 14624119

Name	hadcm3n_o4qe_1940_40_007955163_4
Workunit	8110275
Created	3 May 2012, 11:46:44 UTC
Sent	3 May 2012, 11:47:25 UTC
Report deadline	2 Aug 2012, 19:14:36 UTC
Received	12 Jun 2012, 16:58:18 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	895093
Run time	17 days 10 hours 3 min 48 sec
CPU time	16 days 19 hours 12 min 39 sec
Validate state	Invalid
Credit	10,886.40
Device peak FLOPS	3.22 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.12.33</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 15:13:25 (5148): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 12:12:23 (5800): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5700, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5700, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5700, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5700, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5700, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5700, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
11 Jun 2012 12:08:32	895093	14624119	hadcm3n_o4qe_1940_40_007955163_4	907,200	1,413,433	1.5580
10 Jun 2012 00:13:34	895093	14624119	hadcm3n_o4qe_1940_40_007955163_4	881,280	1,373,126	1.5581
09 Jun 2012 12:21:00	895093	14624119	hadcm3n_o4qe_1940_40_007955163_4	855,360	1,332,943	1.5583
09 Jun 2012 00:31:54	895093	14624119	hadcm3n_o4qe_1940_40_007955163_4	829,440	1,292,060	1.5577
08 Jun 2012 12:47:12	895093	14624119	hadcm3n_o4qe_1940_40_007955163_4	803,520	1,251,375	1.5574
07 Jun 2012 23:33:30	895093	14624119	hadcm3n_o4qe_1940_40_007955163_4	777,600	1,208,752	1.5545
07 Jun 2012 11:17:42	895093	14624119	hadcm3n_o4qe_1940_40_007955163_4	751,680	1,168,011	1.5539
06 Jun 2012 21:25:29	895093	14624119	hadcm3n_o4qe_1940_40_007955163_4	725,760	1,125,148	1.5503
06 Jun 2012 10:12:26	895093	14624119	hadcm3n_o4qe_1940_40_007955163_4	699,840	1,085,826	1.5515
05 Jun 2012 22:18:08	895093	14624119	hadcm3n_o4qe_1940_40_007955163_4	673,920	1,045,661	1.5516
05 Jun 2012 11:09:45	895093	14624119	hadcm3n_o4qe_1940_40_007955163_4	648,000	1,006,732	1.5536
04 Jun 2012 23:59:50	895093	14624119	hadcm3n_o4qe_1940_40_007955163_4	622,080	967,955	1.5560
04 Jun 2012 13:05:39	895093	14624119	hadcm3n_o4qe_1940_40_007955163_4	596,160	929,809	1.5597
04 Jun 2012 01:55:19	895093	14624119	hadcm3n_o4qe_1940_40_007955163_4	570,240	890,881	1.5623
03 Jun 2012 14:55:35	895093	14624119	hadcm3n_o4qe_1940_40_007955163_4	544,320	852,420	1.5660
03 Jun 2012 03:40:36	895093	14624119	hadcm3n_o4qe_1940_40_007955163_4	518,400	813,496	1.5692
02 Jun 2012 16:18:32	895093	14624119	hadcm3n_o4qe_1940_40_007955163_4	492,480	774,167	1.5720
02 Jun 2012 04:52:49	895093	14624119	hadcm3n_o4qe_1940_40_007955163_4	466,560	733,620	1.5724
01 Jun 2012 16:52:34	895093	14624119	hadcm3n_o4qe_1940_40_007955163_4	440,640	693,474	1.5738
01 Jun 2012 05:17:27	895093	14624119	hadcm3n_o4qe_1940_40_007955163_4	414,720	653,780	1.5764