Task 15585799

Name	hadcm3n_y7uw_1940_40_008116842_3
Workunit	8271956
Created	6 Feb 2013, 11:47:47 UTC
Sent	6 Feb 2013, 11:47:52 UTC
Report deadline	8 May 2013, 19:15:03 UTC
Received	19 Apr 2013, 15:22:43 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	-226 (0xFFFFFF1E) ERR_TOO_MANY_EXITS
Computer ID	1128195
Run time	29 days 21 hours 59 min 35 sec
CPU time	23 days 19 hours 57 min 56 sec
Validate state	Invalid
Credit	7,464.96
Device peak FLOPS	2.85 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.58</core_client_version> <![CDATA[ <message> too many exit(0)s </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 18:47:28 (11000): No heartbeat from core client for 30 sec - exiting 18:47:29 (11000): No heartbeat from core client for 30 sec - exiting 18:47:30 (11000): No heartbeat from core client for 30 sec - exiting 18:47:31 (11000): No heartbeat from core client for 30 sec - exiting 18:47:32 (11000): No heartbeat from core client for 30 sec - exiting 18:47:33 (11000): No heartbeat from core client for 30 sec - exiting 18:47:34 (11000): No heartbeat from core client for 30 sec - exiting 18:47:35 (11000): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=16328, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 15:42:41 (4072): No heartbeat from core client for 30 sec - exiting 15:42:42 (4072): No heartbeat from core client for 30 sec - exiting 15:42:43 (4072): No heartbeat from core client for 30 sec - exiting 15:42:44 (4072): No heartbeat from core client for 30 sec - exiting 15:42:45 (4072): No heartbeat from core client for 30 sec - exiting 15:42:46 (4072): No heartbeat from core client for 30 sec - exiting 15:42:47 (4072): No heartbeat from core client for 30 sec - exiting 15:42:48 (4072): No heartbeat from core client for 30 sec - exiting 15:42:49 (4072): No heartbeat from core client for 30 sec - exiting 15:42:50 (4072): No heartbeat from core client for 30 sec - exiting 15:42:51 (4072): No heartbeat from core client for 30 sec - exiting 15:42:52 (4072): No heartbeat from core client for 30 sec - exiting 15:42:53 (4072): No heartbeat from core client for 30 sec - exiting 15:42:54 (4072): No heartbeat from core client for 30 sec - exiting 15:42:55 (4072): No heartbeat from core client for 30 sec - exiting 15:42:56 (4072): No heartbeat from core client for 30 sec - exiting 15:42:57 (4072): No heartbeat from core client for 30 sec - exiting 15:42:58 (4072): No heartbeat from core client for 30 sec - exiting 15:42:59 (4072): No heartbeat from core client for 30 sec - exiting 15:43:00 (4072): No heartbeat from core client for 30 sec - exiting 15:43:01 (4072): No heartbeat from core client for 30 sec - exiting 15:43:02 (4072): No heartbeat from core client for 30 sec - exiting 15:43:03 (4072): No heartbeat from core client for 30 sec - exiting 15:43:04 (4072): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 09:46:36 (3348): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Atmos Hold Restart file rename failed on atmos_restart.hold CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
18 Apr 2013 13:50:11	1128195	15585799	hadcm3n_y7uw_1940_40_008116842_3	622,080	1,983,358	3.1883
17 Apr 2013 09:21:58	1128195	15585799	hadcm3n_y7uw_1940_40_008116842_3	596,160	1,913,273	3.2093
11 Apr 2013 14:30:23	1128195	15585799	hadcm3n_y7uw_1940_40_008116842_3	570,240	1,852,774	3.2491
10 Apr 2013 05:52:08	1128195	15585799	hadcm3n_y7uw_1940_40_008116842_3	544,320	1,757,829	3.2294
04 Apr 2013 09:10:48	1128195	15585799	hadcm3n_y7uw_1940_40_008116842_3	518,400	1,674,449	3.2300
03 Apr 2013 12:37:04	1128195	15585799	hadcm3n_y7uw_1940_40_008116842_3	492,480	1,612,965	3.2752
26 Mar 2013 14:00:08	1128195	15585799	hadcm3n_y7uw_1940_40_008116842_3	466,560	1,562,015	3.3479
21 Mar 2013 03:52:55	1128195	15585799	hadcm3n_y7uw_1940_40_008116842_3	440,640	1,469,603	3.3352
15 Mar 2013 01:51:33	1128195	15585799	hadcm3n_y7uw_1940_40_008116842_3	414,720	1,356,289	3.2704
13 Mar 2013 12:55:55	1128195	15585799	hadcm3n_y7uw_1940_40_008116842_3	388,800	1,249,565	3.2139
12 Mar 2013 03:55:08	1128195	15585799	hadcm3n_y7uw_1940_40_008116842_3	362,880	1,151,909	3.1744
08 Mar 2013 17:21:13	1128195	15585799	hadcm3n_y7uw_1940_40_008116842_3	336,960	1,077,012	3.1963
07 Mar 2013 09:51:12	1128195	15585799	hadcm3n_y7uw_1940_40_008116842_3	311,040	981,776	3.1564
05 Mar 2013 14:05:15	1128195	15585799	hadcm3n_y7uw_1940_40_008116842_3	285,120	900,822	3.1594
03 Mar 2013 23:10:31	1128195	15585799	hadcm3n_y7uw_1940_40_008116842_3	259,200	785,957	3.0322
02 Mar 2013 08:28:17	1128195	15585799	hadcm3n_y7uw_1940_40_008116842_3	233,280	672,507	2.8828
01 Mar 2013 05:46:44	1128195	15585799	hadcm3n_y7uw_1940_40_008116842_3	207,360	595,543	2.8720
24 Feb 2013 04:53:51	1128195	15585799	hadcm3n_y7uw_1940_40_008116842_3	181,440	512,209	2.8230
22 Feb 2013 16:45:49	1128195	15585799	hadcm3n_y7uw_1940_40_008116842_3	155,520	420,086	2.7012
21 Feb 2013 12:25:26	1128195	15585799	hadcm3n_y7uw_1940_40_008116842_3	129,600	344,305	2.6567