Task 16162511

Name	hadcm3n_ofez_1900_40_008475102_1
Workunit	8625941
Created	28 Dec 2013, 1:52:31 UTC
Sent	28 Dec 2013, 1:52:45 UTC
Report deadline	29 Mar 2014, 9:19:56 UTC
Received	20 Jan 2014, 16:16:12 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	25 (0x00000019) Unknown error code
Computer ID	1255461
Run time	23 days 2 hours 35 min 28 sec
CPU time	11 days 6 hours 4 min 44 sec
Validate state	Invalid
Credit	9,642.24
Device peak FLOPS	3.33 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.2.33</core_client_version> <![CDATA[ <message> The drive cannot locate a specific area or track on the disk. (0x19) - exit code 25 (0x19) </message> <stderr_txt> 22:57:51 (5328): No heartbeat from core client for 30 sec - exiting 22:57:52 (5328): No heartbeat from core client for 30 sec - exiting 22:57:53 (5328): No heartbeat from core client for 30 sec - exiting 22:57:54 (5328): No heartbeat from core client for 30 sec - exiting 22:57:55 (5328): No heartbeat from core client for 30 sec - exiting 22:57:56 (5328): No heartbeat from core client for 30 sec - exiting 22:57:57 (5328): No heartbeat from core client for 30 sec - exiting 22:57:58 (5328): No heartbeat from core client for 30 sec - exiting 22:57:59 (5328): No heartbeat from core client for 30 sec - exiting 22:58:00 (5328): No heartbeat from core client for 30 sec - exiting 22:58:01 (5328): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 22:58:02 (5328): No heartbeat from core client for 30 sec - exiting 22:58:03 (5328): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3100, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3100, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3100, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3100, iMonCtr=1 Model crash detected, will try to restart... 22:07:14 (3756): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 00:32:06 (5180): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... C10:44:24 (3660): No heartbeat from core client for 30 sec - exiting 10:44:25 (3660): No heartbeat from core client for 30 sec - exiting 10:44:26 (3660): No heartbeat from core client for 30 sec - exiting 10:44:27 (3660): No heartbeat from core client for 30 sec - exiting 10:44:28 (3660): No heartbeat from core client for 30 sec - exiting 10:44:29 (3660): No heartbeat from core client for 30 sec - exiting 10:44:30 (3660): No heartbeat from core client for 30 sec - exiting 10:44:32 (3660): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 10:44:33 (3660): No heartbeat from core client for 30 sec - exiting 10:44:34 (3660): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - Suspend request from BOINC... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
20 Jan 2014 08:35:16	1255461	16162511	hadcm3n_ofez_1900_40_008475102_1	803,520	952,929	1.1859
19 Jan 2014 19:32:20	1255461	16162511	hadcm3n_ofez_1900_40_008475102_1	777,600	921,359	1.1849
19 Jan 2014 07:49:53	1255461	16162511	hadcm3n_ofez_1900_40_008475102_1	751,680	890,420	1.1846
18 Jan 2014 19:42:01	1255461	16162511	hadcm3n_ofez_1900_40_008475102_1	725,760	859,384	1.1841
18 Jan 2014 08:11:55	1255461	16162511	hadcm3n_ofez_1900_40_008475102_1	699,840	829,395	1.1851
17 Jan 2014 20:19:06	1255461	16162511	hadcm3n_ofez_1900_40_008475102_1	673,920	799,554	1.1864
17 Jan 2014 04:11:04	1255461	16162511	hadcm3n_ofez_1900_40_008475102_1	648,000	770,006	1.1883
16 Jan 2014 07:33:13	1255461	16162511	hadcm3n_ofez_1900_40_008475102_1	622,080	740,975	1.1911
15 Jan 2014 16:38:01	1255461	16162511	hadcm3n_ofez_1900_40_008475102_1	596,160	711,188	1.1929
15 Jan 2014 03:12:32	1255461	16162511	hadcm3n_ofez_1900_40_008475102_1	570,240	680,674	1.1937
14 Jan 2014 13:29:28	1255461	16162511	hadcm3n_ofez_1900_40_008475102_1	544,320	650,236	1.1946
14 Jan 2014 00:41:24	1255461	16162511	hadcm3n_ofez_1900_40_008475102_1	518,400	619,193	1.1944
13 Jan 2014 12:08:56	1255461	16162511	hadcm3n_ofez_1900_40_008475102_1	492,480	587,902	1.1938
12 Jan 2014 23:35:48	1255461	16162511	hadcm3n_ofez_1900_40_008475102_1	466,560	557,035	1.1939
12 Jan 2014 12:09:17	1255461	16162511	hadcm3n_ofez_1900_40_008475102_1	440,640	526,306	1.1944
11 Jan 2014 12:28:33	1255461	16162511	hadcm3n_ofez_1900_40_008475102_1	414,720	495,016	1.1936
11 Jan 2014 00:09:10	1255461	16162511	hadcm3n_ofez_1900_40_008475102_1	388,800	462,106	1.1885
10 Jan 2014 08:52:24	1255461	16162511	hadcm3n_ofez_1900_40_008475102_1	362,880	428,449	1.1807
09 Jan 2014 21:38:59	1255461	16162511	hadcm3n_ofez_1900_40_008475102_1	336,960	396,309	1.1761
09 Jan 2014 09:32:20	1255461	16162511	hadcm3n_ofez_1900_40_008475102_1	311,040	363,937	1.1701