Task 13006222

Name	hadcm3n_o28t_1940_40_007308634_1
Workunit	7506058
Created	26 Jun 2011, 19:37:36 UTC
Sent	26 Jun 2011, 19:37:51 UTC
Report deadline	26 Sep 2011, 3:05:02 UTC
Received	13 Oct 2011, 15:01:06 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	-226 (0xFFFFFF1E) ERR_TOO_MANY_EXITS
Computer ID	1015297
Run time	14 days 14 hours 44 min 34 sec
CPU time	12 days 12 hours 8 min 15 sec
Validate state	Invalid
Credit	5,598.72
Device peak FLOPS	2.05 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.6.38</core_client_version> <![CDATA[ <message> too many exit(0)s </message> <stderr_txt> 15:03:55 (2340): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 15:03:57 (2340): No heartbeat from core client for 30 sec - exiting 15:03:58 (2340): No heartbeat from core client for 30 sec - exiting 15:03:59 (2340): No heartbeat from core client for 30 sec - exiting 15:04:00 (2340): No heartbeat from core client for 30 sec - exiting 17:34:05 (1164): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 17:34:06 (1164): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=2428, selfPID=2428, iMonCtr=1 CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=860, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 11:15:47 (4888): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5096, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 13:24:43 (2220): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 06:39:31 (3228): No heartbeat from core client for 30 sec - exiting 06:39:32 (3228): No heartbeat from core client for 30 sec - exiting 06:39:33 (3228): No heartbeat from core client for 30 sec - exiting 06:39:34 (3228): No heartbeat from core client for 30 sec - exiting 06:39:35 (3228): No heartbeat from core client for 30 sec - exiting 06:39:36 (3228): No heartbeat from core client for 30 sec - exiting 06:39:37 (3228): No heartbeat from core client for 30 sec - exiting 06:39:38 (3228): No heartbeat from core client for 30 sec - exiting 06:39:39 (3228): No heartbeat from core client for 30 sec - exiting 06:39:40 (3228): No heartbeat from core client for 30 sec - exiting 06:39:41 (3228): No heartbeat from core client for 30 sec - exiting 06:39:42 (3228): No heartbeat from core client for 30 sec - exiting 06:39:43 (3228): No heartbeat from core client for 30 sec - exiting 06:39:44 (3228): No heartbeat from core client for 30 sec - exiting 06:39:45 (3228): No heartbeat from core client for 30 sec - exiting 06:39:46 (3228): No heartbeat from core client for 30 sec - exiting 06:39:47 (3228): No heartbeat from core client for 30 sec - exiting 06:39:48 (3228): No heartbeat from core client for 30 sec - exiting 06:39:49 (3228): No heartbeat from core client for 30 sec - exiting 06:39:50 (3228): No heartbeat from core client for 30 sec - exiting 06:39:51 (3228): No heartbeat from core client for 30 sec - exiting 06:39:52 (3228): No heartbeat from core client for 30 sec - exiting 06:39:53 (3228): No heartbeat from core client for 30 sec - exiting 06:39:55 (3228): No heartbeat from core client for 30 sec - exiting 06:39:56 (3228): No heartbeat from core client for 30 sec - exiting 06:39:57 (3228): No heartbeat from core client for 30 sec - exiting 06:39:58 (3228): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 08:33:55 (900): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
03 Oct 2011 07:42:08	1015297	13006222	hadcm3n_o28t_1940_40_007308634_1	466,560	1,053,120	2.2572
28 Sep 2011 15:05:38	1015297	13006222	hadcm3n_o28t_1940_40_007308634_1	440,640	998,727	2.2665
08 Sep 2011 10:42:37	1015297	13006222	hadcm3n_o28t_1940_40_007308634_1	414,720	944,007	2.2763
28 Aug 2011 04:41:52	1015297	13006222	hadcm3n_o28t_1940_40_007308634_1	388,800	864,604	2.2238
30 Jul 2011 01:27:24	1015297	13006222	hadcm3n_o28t_1940_40_007308634_1	362,880	804,215	2.2162
29 Jul 2011 06:08:52	1015297	13006222	hadcm3n_o28t_1940_40_007308634_1	336,960	749,284	2.2237
26 Jul 2011 15:26:44	1015297	13006222	hadcm3n_o28t_1940_40_007308634_1	311,040	694,355	2.2324
25 Jul 2011 23:16:25	1015297	13006222	hadcm3n_o28t_1940_40_007308634_1	285,120	639,857	2.2442
25 Jul 2011 22:24:37	1015297	13006222	hadcm3n_o28t_1940_40_007308634_1	259,200	586,218	2.2616
25 Jul 2011 21:50:29	1015297	13006222	hadcm3n_o28t_1940_40_007308634_1	233,280	531,450	2.2782
25 Jul 2011 16:42:07	1015297	13006222	hadcm3n_o28t_1940_40_007308634_1	207,360	476,378	2.2973
25 Jul 2011 16:20:46	1015297	13006222	hadcm3n_o28t_1940_40_007308634_1	181,440	417,221	2.2995
25 Jul 2011 16:20:46	1015297	13006222	hadcm3n_o28t_1940_40_007308634_1	155,520	356,096	2.2897
07 Jul 2011 17:54:56	1015297	13006222	hadcm3n_o28t_1940_40_007308634_1	129,600	294,497	2.2724
07 Jul 2011 17:54:56	1015297	13006222	hadcm3n_o28t_1940_40_007308634_1	103,680	235,040	2.2670
01 Jul 2011 16:08:06	1015297	13006222	hadcm3n_o28t_1940_40_007308634_1	77,760	175,272	2.2540
30 Jun 2011 01:46:47	1015297	13006222	hadcm3n_o28t_1940_40_007308634_1	51,840	116,686	2.2509
29 Jun 2011 01:05:07	1015297	13006222	hadcm3n_o28t_1940_40_007308634_1	25,920	58,375	2.2521