Task 15599383

Name	hadcm3n_4gqm_1940_40_008311706_0
Workunit	8462841
Created	8 Feb 2013, 5:28:26 UTC
Sent	8 Feb 2013, 18:30:51 UTC
Report deadline	11 May 2013, 1:58:02 UTC
Received	14 Mar 2013, 7:45:44 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	-226 (0xFFFFFF1E) ERR_TOO_MANY_EXITS
Computer ID	1267864
Run time	17 days 17 hours 40 min 46 sec
CPU time	14 days 0 hours 9 min 29 sec
Validate state	Invalid
Credit	8,398.08
Device peak FLOPS	2.94 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> too many exit(0)s </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7324, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 03:43:53 (7184): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 03:43:54 (7184): No heartbeat from core client for 30 sec - exiting 03:43:55 (7184): No heartbeat from core client for 30 sec - exiting 03:43:56 (7184): No heartbeat from core client for 30 sec - exiting 03:43:57 (7184): No heartbeat from core client for 30 sec - exiting 03:43:58 (7184): No heartbeat from core client for 30 sec - exiting 03:43:59 (7184): No heartbeat from core client for 30 sec - exiting 03:44:00 (7184): No heartbeat from core client for 30 sec - exiting 03:44:01 (7184): No heartbeat from core client for 30 sec - exiting 03:44:02 (7184): No heartbeat from core client for 30 sec - exiting 03:44:03 (7184): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Atmos Hold Restart file rename failed on atmos_restart.hold CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7064, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4428, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5344, iMonCtr=1 Model crash detected, will try to restart... </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
13 Mar 2013 22:11:29	1267864	15599383	hadcm3n_4gqm_1940_40_008311706_0	699,840	1,201,539	1.7169
13 Mar 2013 07:04:29	1267864	15599383	hadcm3n_4gqm_1940_40_008311706_0	673,920	1,156,774	1.7165
12 Mar 2013 05:45:40	1267864	15599383	hadcm3n_4gqm_1940_40_008311706_0	648,000	1,112,388	1.7166
11 Mar 2013 04:26:15	1267864	15599383	hadcm3n_4gqm_1940_40_008311706_0	622,080	1,067,438	1.7159
10 Mar 2013 00:54:41	1267864	15599383	hadcm3n_4gqm_1940_40_008311706_0	596,160	1,018,900	1.7091
09 Mar 2013 01:35:39	1267864	15599383	hadcm3n_4gqm_1940_40_008311706_0	570,240	974,890	1.7096
08 Mar 2013 01:54:19	1267864	15599383	hadcm3n_4gqm_1940_40_008311706_0	544,320	930,454	1.7094
07 Mar 2013 00:27:13	1267864	15599383	hadcm3n_4gqm_1940_40_008311706_0	518,400	884,537	1.7063
05 Mar 2013 23:03:28	1267864	15599383	hadcm3n_4gqm_1940_40_008311706_0	492,480	839,577	1.7048
04 Mar 2013 22:02:25	1267864	15599383	hadcm3n_4gqm_1940_40_008311706_0	466,560	793,937	1.7017
28 Feb 2013 20:02:21	1267864	15599383	hadcm3n_4gqm_1940_40_008311706_0	440,640	747,837	1.6972
27 Feb 2013 00:34:50	1267864	15599383	hadcm3n_4gqm_1940_40_008311706_0	414,720	702,644	1.6943
25 Feb 2013 19:18:03	1267864	15599383	hadcm3n_4gqm_1940_40_008311706_0	388,800	654,607	1.6837
21 Feb 2013 19:36:29	1267864	15599383	hadcm3n_4gqm_1940_40_008311706_0	362,880	606,623	1.6717
20 Feb 2013 07:22:49	1267864	15599383	hadcm3n_4gqm_1940_40_008311706_0	336,960	561,472	1.6663
19 Feb 2013 08:13:09	1267864	15599383	hadcm3n_4gqm_1940_40_008311706_0	311,040	518,245	1.6662
18 Feb 2013 19:42:35	1267864	15599383	hadcm3n_4gqm_1940_40_008311706_0	285,120	476,929	1.6727
17 Feb 2013 21:04:50	1267864	15599383	hadcm3n_4gqm_1940_40_008311706_0	259,200	433,844	1.6738
17 Feb 2013 04:51:11	1267864	15599383	hadcm3n_4gqm_1940_40_008311706_0	233,280	390,932	1.6758
16 Feb 2013 11:29:30	1267864	15599383	hadcm3n_4gqm_1940_40_008311706_0	207,360	347,763	1.6771