Task 13412143

Name	hadcm3n_u6ho_1980_40_007460233_2
Workunit	7657736
Created	23 Sep 2011, 0:05:39 UTC
Sent	24 Sep 2011, 0:51:28 UTC
Report deadline	24 Dec 2011, 8:18:39 UTC
Received	31 Oct 2011, 18:45:01 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	25 (0x00000019) Unknown error code
Computer ID	1072042
Run time	12 days 23 hours 10 min 24 sec
CPU time	11 days 15 hours 39 min 7 sec
Validate state	Invalid
Credit	8,398.08
Device peak FLOPS	2.65 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.56</core_client_version> <![CDATA[ <message> The drive cannot locate a specific area or track on the disk. (0x19) - exit code 25 (0x19) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4588, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 13:18:42 (5312): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 13:23:42 (4392): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 13:23:44 (4392): No heartbeat from core client for 30 sec - exiting 13:23:45 (4392): No heartbeat from core client for 30 sec - exiting 13:23:46 (4392): No heartbeat from core client for 30 sec - exiting 13:23:47 (4392): No heartbeat from core client for 30 sec - exiting 13:23:48 (4392): No heartbeat from core client for 30 sec - exiting 13:23:49 (4392): No heartbeat from core client for 30 sec - exiting 13:23:50 (4392): No heartbeat from core client for 30 sec - exiting 13:23:51 (4392): No heartbeat from core client for 30 sec - exiting 13:23:52 (4392): No heartbeat from core client for 30 sec - exiting 13:23:53 (4392): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... 18:42:44 (3940): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 18:42:45 (3940): No heartbeat from core client for 30 sec - exiting 18:42:46 (3940): No heartbeat from core client for 30 sec - exiting 18:42:47 (3940): No heartbeat from core client for 30 sec - exiting 18:42:48 (3940): No heartbeat from core client for 30 sec - exiting 18:42:49 (3940): No heartbeat from core client for 30 sec - exiting 18:42:50 (3940): No heartbeat from core client for 30 sec - exiting 18:42:51 (3940): No heartbeat from core client for 30 sec - exiting 18:42:52 (3940): No heartbeat from core client for 30 sec - exiting 18:42:53 (3940): No heartbeat from core client for 30 sec - exiting 18:42:54 (3940): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5416, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 18:43:27 (1944): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 18:43:28 (1944): No heartbeat from core client for 30 sec - exiting 18:43:29 (1944): No heartbeat from core client for 30 sec - exiting 18:43:30 (1944): No heartbeat from core client for 30 sec - exiting 18:43:31 (1944): No heartbeat from core client for 30 sec - exiting 18:43:32 (1944): No heartbeat from core client for 30 sec - exiting 18:44:07 (5232): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 18:45:04 (2584): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 18:48:28 (908): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 20:48:37 (5964): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 20:48:38 (5964): No heartbeat from core client for 30 sec - exiting 20:48:39 (5964): No heartbeat from core client for 30 sec - exiting 20:48:40 (5964): No heartbeat from core client for 30 sec - exiting 20:48:41 (5964): No heartbeat from core client for 30 sec - exiting 20:48:42 (5964): No heartbeat from core client for 30 sec - exiting 20:48:43 (5964): No heartbeat from core client for 30 sec - exiting 20:48:44 (5964): No heartbeat from core client for 30 sec - exiting 20:48:45 (5964): No heartbeat from core client for 30 sec - exiting 20:48:46 (5964): No heartbeat from core client for 30 sec - exiting 20:48:47 (5964): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=212, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=212, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=212, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 03:01:21 (1680): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
31 Oct 2011 19:33:56	1072042	13412143	hadcm3n_u6ho_1980_40_007460233_2	699,840	998,139	1.4262
31 Oct 2011 18:55:07	1072042	13412143	hadcm3n_u6ho_1980_40_007460233_2	673,920	960,931	1.4259
31 Oct 2011 17:25:48	1072042	13412143	hadcm3n_u6ho_1980_40_007460233_2	648,000	923,597	1.4253
31 Oct 2011 16:47:13	1072042	13412143	hadcm3n_u6ho_1980_40_007460233_2	622,080	886,393	1.4249
31 Oct 2011 15:22:16	1072042	13412143	hadcm3n_u6ho_1980_40_007460233_2	596,160	849,525	1.4250
31 Oct 2011 15:22:16	1072042	13412143	hadcm3n_u6ho_1980_40_007460233_2	570,240	813,801	1.4271
31 Oct 2011 15:22:16	1072042	13412143	hadcm3n_u6ho_1980_40_007460233_2	544,320	776,589	1.4267
31 Oct 2011 15:22:16	1072042	13412143	hadcm3n_u6ho_1980_40_007460233_2	518,400	738,600	1.4248
31 Oct 2011 15:22:14	1072042	13412143	hadcm3n_u6ho_1980_40_007460233_2	492,480	701,563	1.4246
19 Oct 2011 03:09:16	1072042	13412143	hadcm3n_u6ho_1980_40_007460233_2	466,560	663,663	1.4225
17 Oct 2011 22:07:04	1072042	13412143	hadcm3n_u6ho_1980_40_007460233_2	440,640	626,469	1.4217
17 Oct 2011 03:26:05	1072042	13412143	hadcm3n_u6ho_1980_40_007460233_2	414,720	588,783	1.4197
16 Oct 2011 03:22:58	1072042	13412143	hadcm3n_u6ho_1980_40_007460233_2	388,800	551,073	1.4174
15 Oct 2011 01:20:55	1072042	13412143	hadcm3n_u6ho_1980_40_007460233_2	362,880	514,540	1.4179
14 Oct 2011 05:05:59	1072042	13412143	hadcm3n_u6ho_1980_40_007460233_2	336,960	478,848	1.4211
13 Oct 2011 19:46:45	1072042	13412143	hadcm3n_u6ho_1980_40_007460233_2	311,040	445,081	1.4309
13 Oct 2011 03:08:31	1072042	13412143	hadcm3n_u6ho_1980_40_007460233_2	285,120	411,146	1.4420
11 Oct 2011 19:37:08	1072042	13412143	hadcm3n_u6ho_1980_40_007460233_2	259,200	374,823	1.4461
10 Oct 2011 23:06:43	1072042	13412143	hadcm3n_u6ho_1980_40_007460233_2	233,280	337,005	1.4446
10 Oct 2011 03:59:05	1072042	13412143	hadcm3n_u6ho_1980_40_007460233_2	207,360	298,830	1.4411