Task 13013774

Name	hadcm3n_t1zf_1940_40_007311478_0
Workunit	7508908
Created	27 Jun 2011, 23:21:16 UTC
Sent	27 Jun 2011, 23:21:27 UTC
Report deadline	27 Sep 2011, 6:48:38 UTC
Received	23 Jul 2011, 11:04:03 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	25 (0x00000019) Unknown error code
Computer ID	1065462
Run time	14 days 5 hours 2 min 33 sec
CPU time	12 days 19 hours 22 min 51 sec
Validate state	Invalid
Credit	6,842.88
Device peak FLOPS	2.65 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.18</core_client_version> <![CDATA[ <message> The drive cannot locate a specific area or track on the disk. (0x19) - exit code 25 (0x19) </message> <stderr_txt> Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2272, iMonCtr=1 Model crash detected, will try to restart... 08:42:05 (3292): No heartbeat from core client for 30 sec - exiting 08:42:06 (3292): No heartbeat from core client for 30 sec - exiting 08:42:07 (3292): No heartbeat from core client for 30 sec - exiting 08:42:09 (3292): No heartbeat from core client for 30 sec - exiting 08:42:10 (3292): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 16:02:40 (2264): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 16:29:50 (2880): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 17:37:57 (7352): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 17:37:59 (7352): No heartbeat from core client for 30 sec - exiting Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5412, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4452, iMonCtr=1 Model crash detected, will try to restart... 15:54:15 (6056): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 15:54:16 (6056): No heartbeat from core client for 30 sec - exiting 15:54:17 (6056): No heartbeat from core client for 30 sec - exiting 16:29:49 (2604): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 17:30:36 (8044): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3844, iMonCtr=1 Model crash detected, will try to restart... 19:52:12 (6876): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 19:52:13 (6876): No heartbeat from core client for 30 sec - exiting Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5428, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 12:58:00 (4444): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 15:46:01 (212): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
25 Jul 2011 20:41:19	1065462	13013774	hadcm3n_t1zf_1940_40_007311478_0	570,240	1,096,536	1.9229
25 Jul 2011 18:54:49	1065462	13013774	hadcm3n_t1zf_1940_40_007311478_0	544,320	1,050,792	1.9305
25 Jul 2011 17:45:57	1065462	13013774	hadcm3n_t1zf_1940_40_007311478_0	518,400	1,002,914	1.9346
25 Jul 2011 16:39:54	1065462	13013774	hadcm3n_t1zf_1940_40_007311478_0	492,480	952,304	1.9337
25 Jul 2011 15:54:00	1065462	13013774	hadcm3n_t1zf_1940_40_007311478_0	466,560	901,433	1.9321
25 Jul 2011 15:31:41	1065462	13013774	hadcm3n_t1zf_1940_40_007311478_0	440,640	854,844	1.9400
25 Jul 2011 15:31:41	1065462	13013774	hadcm3n_t1zf_1940_40_007311478_0	414,720	806,742	1.9453
25 Jul 2011 15:31:41	1065462	13013774	hadcm3n_t1zf_1940_40_007311478_0	388,800	757,922	1.9494
25 Jul 2011 15:31:41	1065462	13013774	hadcm3n_t1zf_1940_40_007311478_0	362,880	707,879	1.9507
25 Jul 2011 15:31:41	1065462	13013774	hadcm3n_t1zf_1940_40_007311478_0	336,960	659,078	1.9560
11 Jul 2011 03:01:08	1065462	13013774	hadcm3n_t1zf_1940_40_007311478_0	311,040	609,321	1.9590
10 Jul 2011 05:10:32	1065462	13013774	hadcm3n_t1zf_1940_40_007311478_0	285,120	557,846	1.9565
09 Jul 2011 13:31:57	1065462	13013774	hadcm3n_t1zf_1940_40_007311478_0	259,200	505,037	1.9484
08 Jul 2011 23:15:49	1065462	13013774	hadcm3n_t1zf_1940_40_007311478_0	233,280	453,202	1.9427
08 Jul 2011 07:43:31	1065462	13013774	hadcm3n_t1zf_1940_40_007311478_0	207,360	400,996	1.9338
07 Jul 2011 16:04:46	1065462	13013774	hadcm3n_t1zf_1940_40_007311478_0	181,440	348,998	1.9235
07 Jul 2011 15:42:17	1065462	13013774	hadcm3n_t1zf_1940_40_007311478_0	155,520	296,637	1.9074
05 Jul 2011 20:41:22	1065462	13013774	hadcm3n_t1zf_1940_40_007311478_0	129,600	247,827	1.9122
30 Jun 2011 18:15:37	1065462	13013774	hadcm3n_t1zf_1940_40_007311478_0	103,680	197,493	1.9048
29 Jun 2011 23:31:02	1065462	13013774	hadcm3n_t1zf_1940_40_007311478_0	77,760	147,138	1.8922