Task 15589252

Name	hadcm3n_4jm1_1940_40_008303620_0
Workunit	8454755
Created	6 Feb 2013, 23:30:41 UTC
Sent	6 Feb 2013, 23:30:59 UTC
Report deadline	9 May 2013, 6:58:10 UTC
Received	28 Feb 2013, 12:47:47 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	25 (0x00000019) Unknown error code
Computer ID	1181449
Run time	10 days 16 hours 11 min
CPU time	10 days 8 hours 30 min 39 sec
Validate state	Invalid
Credit	7,153.92
Device peak FLOPS	3.31 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> The drive cannot locate a specific area or track on the disk. (0x19) - exit code 25 (0x19) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6320, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5412, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4592, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6484, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6484, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6484, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5236, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5560, iMonCtr=1 Model crash detected, will try to restart... 08:40:38 (4816): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
28 Feb 2013 00:10:25	1181449	15589252	hadcm3n_4jm1_1940_40_008303620_0	596,160	869,827	1.4590
27 Feb 2013 13:15:08	1181449	15589252	hadcm3n_4jm1_1940_40_008303620_0	570,240	831,422	1.4580
27 Feb 2013 02:20:21	1181449	15589252	hadcm3n_4jm1_1940_40_008303620_0	544,320	792,882	1.4566
26 Feb 2013 00:57:38	1181449	15589252	hadcm3n_4jm1_1940_40_008303620_0	518,400	754,436	1.4553
25 Feb 2013 13:51:28	1181449	15589252	hadcm3n_4jm1_1940_40_008303620_0	492,480	715,644	1.4531
25 Feb 2013 02:47:37	1181449	15589252	hadcm3n_4jm1_1940_40_008303620_0	466,560	676,915	1.4509
24 Feb 2013 16:26:36	1181449	15589252	hadcm3n_4jm1_1940_40_008303620_0	440,640	638,362	1.4487
24 Feb 2013 05:29:06	1181449	15589252	hadcm3n_4jm1_1940_40_008303620_0	414,720	599,595	1.4458
23 Feb 2013 18:17:03	1181449	15589252	hadcm3n_4jm1_1940_40_008303620_0	388,800	560,943	1.4428
23 Feb 2013 06:16:37	1181449	15589252	hadcm3n_4jm1_1940_40_008303620_0	362,880	522,239	1.4392
22 Feb 2013 19:23:52	1181449	15589252	hadcm3n_4jm1_1940_40_008303620_0	336,960	483,422	1.4347
22 Feb 2013 08:47:00	1181449	15589252	hadcm3n_4jm1_1940_40_008303620_0	311,040	444,805	1.4301
21 Feb 2013 14:55:38	1181449	15589252	hadcm3n_4jm1_1940_40_008303620_0	285,120	406,612	1.4261
20 Feb 2013 19:39:18	1181449	15589252	hadcm3n_4jm1_1940_40_008303620_0	259,200	368,242	1.4207
19 Feb 2013 23:36:09	1181449	15589252	hadcm3n_4jm1_1940_40_008303620_0	233,280	329,727	1.4134
19 Feb 2013 12:55:11	1181449	15589252	hadcm3n_4jm1_1940_40_008303620_0	207,360	291,562	1.4061
18 Feb 2013 20:28:53	1181449	15589252	hadcm3n_4jm1_1940_40_008303620_0	181,440	253,239	1.3957
18 Feb 2013 09:38:29	1181449	15589252	hadcm3n_4jm1_1940_40_008303620_0	155,520	214,847	1.3815
17 Feb 2013 15:50:40	1181449	15589252	hadcm3n_4jm1_1940_40_008303620_0	129,600	178,245	1.3753
17 Feb 2013 04:56:12	1181449	15589252	hadcm3n_4jm1_1940_40_008303620_0	103,680	142,977	1.3790