Task 15986623

Name	hadcm3n_7w4t_1980_40_008452928_0
Workunit	8603784
Created	30 Aug 2013, 16:52:34 UTC
Sent	18 Sep 2013, 11:11:21 UTC
Report deadline	18 Dec 2013, 18:38:32 UTC
Received	14 Oct 2013, 13:19:14 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	193 (0x000000C1) EXIT_SIGNAL
Computer ID	1263968
Run time	13 days 21 hours 35 min 17 sec
CPU time	13 days 5 hours 7 min 40 sec
Validate state	Invalid
Credit	6,220.80
Device peak FLOPS	2.26 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.2.5</core_client_version> <![CDATA[ <message> (unknown error) - exit code 193 (0xc1) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 13:06:23 (9428): No heartbeat from core client for 30 sec - exiting 13:06:24 (9428): No heartbeat from core client for 30 sec - exiting 13:06:25 (9428): No heartbeat from core client for 30 sec - exiting 13:06:26 (9428): No heartbeat from core client for 30 sec - exiting 13:06:27 (9428): No heartbeat from core client for 30 sec - exiting 13:06:28 (9428): No heartbeat from core client for 30 sec - exiting 13:06:29 (9428): No heartbeat from core client for 30 sec - exiting 13:06:30 (9428): No heartbeat from core client for 30 sec - exiting 13:06:31 (9428): No heartbeat from core client for 30 sec - exiting 13:06:32 (9428): No heartbeat from core client for 30 sec - exiting 13:06:33 (9428): No heartbeat from core client for 30 sec - exiting 13:06:34 (9428): No heartbeat from core client for 30 sec - exiting 13:06:35 (9428): No heartbeat from core client for 30 sec - exiting 13:06:36 (9428): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 16:48:19 (17676): No heartbeat from core client for 30 sec - exiting 16:48:20 (17676): No heartbeat from core client for 30 sec - exiting 16:48:21 (17676): No heartbeat from core client for 30 sec - exiting 16:48:22 (17676): No heartbeat from core client for 30 sec - exiting 16:48:23 (17676): No heartbeat from core client for 30 sec - exiting 16:48:24 (17676): No heartbeat from core client for 30 sec - exiting 16:48:25 (17676): No heartbeat from core client for 30 sec - exiting 16:48:26 (17676): No heartbeat from core client for 30 sec - exiting 16:48:27 (17676): No heartbeat from core client for 30 sec - exiting 16:48:28 (17676): No heartbeat from core client for 30 sec - exiting 16:48:29 (17676): No heartbeat from core client for 30 sec - exiting 16:48:30 (17676): No heartbeat from core client for 30 sec - exiting 16:48:31 (17676): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=28648, iMonCtr=1 Model crash detected, will try to restart... 09:17:23 (4404): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 14:01:12 (8548): No heartbeat from core client for 30 sec - exiting 14:01:13 (8548): No heartbeat from core client for 30 sec - exiting 14:01:14 (8548): No heartbeat from core client for 30 sec - exiting 14:01:15 (8548): No heartbeat from core client for 30 sec - exiting 14:01:16 (8548): No heartbeat from core client for 30 sec - exiting 14:01:17 (8548): No heartbeat from core client for 30 sec - exiting 14:01:18 (8548): No heartbeat from core client for 30 sec - exiting 14:01:19 (8548): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 14:01:20 (8548): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Model crashed: TEMPHIST: Failed in OPEN of history file tmp/pipe_dummy 2048 CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 15:50:12 (9948): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 11 received, exiting... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
14 Oct 2013 13:20:18	1263968	15986623	hadcm3n_7w4t_1980_40_008452928_0	518,400	1,141,654	2.2023
13 Oct 2013 20:25:44	1263968	15986623	hadcm3n_7w4t_1980_40_008452928_0	492,480	1,083,088	2.1993
13 Oct 2013 02:42:04	1263968	15986623	hadcm3n_7w4t_1980_40_008452928_0	466,560	1,024,625	2.1961
12 Oct 2013 10:00:21	1263968	15986623	hadcm3n_7w4t_1980_40_008452928_0	440,640	966,070	2.1924
11 Oct 2013 15:59:28	1263968	15986623	hadcm3n_7w4t_1980_40_008452928_0	414,720	907,346	2.1879
10 Oct 2013 22:24:34	1263968	15986623	hadcm3n_7w4t_1980_40_008452928_0	388,800	862,852	2.2193
10 Oct 2013 01:57:23	1263968	15986623	hadcm3n_7w4t_1980_40_008452928_0	362,880	804,909	2.2181
09 Oct 2013 08:12:08	1263968	15986623	hadcm3n_7w4t_1980_40_008452928_0	336,960	746,651	2.2158
08 Oct 2013 12:28:58	1263968	15986623	hadcm3n_7w4t_1980_40_008452928_0	311,040	687,915	2.2117
07 Oct 2013 17:03:19	1263968	15986623	hadcm3n_7w4t_1980_40_008452928_0	285,120	629,008	2.2061
06 Oct 2013 23:43:54	1263968	15986623	hadcm3n_7w4t_1980_40_008452928_0	259,200	572,592	2.2091
06 Oct 2013 08:09:34	1263968	15986623	hadcm3n_7w4t_1980_40_008452928_0	233,280	516,627	2.2146
05 Oct 2013 15:59:44	1263968	15986623	hadcm3n_7w4t_1980_40_008452928_0	207,360	459,680	2.2168
30 Sep 2013 23:56:43	1263968	15986623	hadcm3n_7w4t_1980_40_008452928_0	181,440	401,728	2.2141
30 Sep 2013 07:19:27	1263968	15986623	hadcm3n_7w4t_1980_40_008452928_0	155,520	343,994	2.2119
29 Sep 2013 14:21:11	1263968	15986623	hadcm3n_7w4t_1980_40_008452928_0	129,600	287,688	2.2198
28 Sep 2013 21:55:24	1263968	15986623	hadcm3n_7w4t_1980_40_008452928_0	103,680	231,005	2.2281
27 Sep 2013 09:58:01	1263968	15986623	hadcm3n_7w4t_1980_40_008452928_0	77,760	173,769	2.2347
26 Sep 2013 12:54:17	1263968	15986623	hadcm3n_7w4t_1980_40_008452928_0	51,840	115,744	2.2327
25 Sep 2013 09:25:42	1263968	15986623	hadcm3n_7w4t_1980_40_008452928_0	25,920	57,873	2.2328