Task 13281592

Name	hadcm3n_yepb_1900_40_007351913_2
Workunit	7549343
Created	20 Aug 2011, 15:28:52 UTC
Sent	20 Aug 2011, 15:28:55 UTC
Report deadline	19 Nov 2011, 22:56:06 UTC
Received	15 Nov 2011, 16:36:40 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	25 (0x00000019) Unknown error code
Computer ID	1152924
Run time	24 days 17 hours 54 min 19 sec
CPU time	22 days 7 hours 24 min 50 sec
Validate state	Invalid
Credit	8,087.04
Device peak FLOPS	1.75 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.60</core_client_version> <![CDATA[ <message> The drive cannot locate a specific area or track on the disk. (0x19) - exit code 25 (0x19) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 14:41:13 (6976): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 14:54:02 (6196): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... cpdnmonitor: error reading file C:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_yepb_1900_40_007351913/dataout/atmos_restart.day cpdnmonitor: error reading file C:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_yepb_1900_40_007351913/dataout/atmos_restart.day BUFFIN: C I/O Error ferror - Unit 21 - Return code = 32 Model crashed: READDUMP: BAD BUFFIN OF DATA tmp/pipe_dummy 2048 cpdnmonitor: error reading file C:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_yepb_1900_40_007351913/dataout/atmos_restart.day BUFFIN: C I/O Error ferror - Unit 21 - Return code = 32 Model crashed: READDUMP: BAD BUFFIN OF DATA tmp/pipe_dummy 2048 cpdnmonitor: error reading file C:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_yepb_1900_40_007351913/dataout/atmos_restart.day BUFFIN: C I/O Error ferror - Unit 21 - Return code = 32 Model crashed: READDUMP: BAD BUFFIN OF DATA tmp/pipe_dummy 2048 19:15:51 (5360): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Atmos Hold Restart file rename failed on atmos_restart.hold 18:25:46 (4568): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 18:27:02 (5252): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 18:27:03 (5252): No heartbeat from core client for 30 sec - exiting 18:27:04 (5252): No heartbeat from core client for 30 sec - exiting 18:27:05 (5252): No heartbeat from core client for 30 sec - exiting 18:27:06 (5252): No heartbeat from core client for 30 sec - exiting 18:27:07 (5252): No heartbeat from core client for 30 sec - exiting 14:51:09 (3180): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1976, iMonCtr=1 Model crash detected, will try to restart... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
07 Nov 2011 17:14:58	1152924	13281592	hadcm3n_yepb_1900_40_007351913_2	673,920	1,892,016	2.8075
06 Nov 2011 20:04:12	1152924	13281592	hadcm3n_yepb_1900_40_007351913_2	648,000	1,820,233	2.8090
05 Nov 2011 21:59:50	1152924	13281592	hadcm3n_yepb_1900_40_007351913_2	622,080	1,747,111	2.8085
04 Nov 2011 10:30:02	1152924	13281592	hadcm3n_yepb_1900_40_007351913_2	596,160	1,679,177	2.8167
06 Oct 2011 07:01:18	1152924	13281592	hadcm3n_yepb_1900_40_007351913_2	570,240	1,606,239	2.8168
04 Oct 2011 23:30:45	1152924	13281592	hadcm3n_yepb_1900_40_007351913_2	544,320	1,530,931	2.8126
03 Oct 2011 03:21:54	1152924	13281592	hadcm3n_yepb_1900_40_007351913_2	518,400	1,459,092	2.8146
01 Oct 2011 18:58:30	1152924	13281592	hadcm3n_yepb_1900_40_007351913_2	492,480	1,386,699	2.8157
30 Sep 2011 10:48:02	1152924	13281592	hadcm3n_yepb_1900_40_007351913_2	466,560	1,313,877	2.8161
29 Sep 2011 12:03:38	1152924	13281592	hadcm3n_yepb_1900_40_007351913_2	440,640	1,242,041	2.8187
28 Sep 2011 14:24:54	1152924	13281592	hadcm3n_yepb_1900_40_007351913_2	414,720	1,170,483	2.8223
27 Sep 2011 02:38:53	1152924	13281592	hadcm3n_yepb_1900_40_007351913_2	388,800	1,101,865	2.8340
26 Sep 2011 01:34:51	1152924	13281592	hadcm3n_yepb_1900_40_007351913_2	362,880	1,033,800	2.8489
25 Sep 2011 02:41:33	1152924	13281592	hadcm3n_yepb_1900_40_007351913_2	336,960	962,465	2.8563
24 Sep 2011 04:03:55	1152924	13281592	hadcm3n_yepb_1900_40_007351913_2	311,040	891,100	2.8649
02 Sep 2011 15:45:30	1152924	13281592	hadcm3n_yepb_1900_40_007351913_2	285,120	817,437	2.8670
31 Aug 2011 21:04:30	1152924	13281592	hadcm3n_yepb_1900_40_007351913_2	259,200	745,029	2.8743
30 Aug 2011 22:53:14	1152924	13281592	hadcm3n_yepb_1900_40_007351913_2	233,280	670,199	2.8729
30 Aug 2011 01:13:43	1152924	13281592	hadcm3n_yepb_1900_40_007351913_2	207,360	596,737	2.8778
29 Aug 2011 03:11:25	1152924	13281592	hadcm3n_yepb_1900_40_007351913_2	181,440	522,113	2.8776