Task 16193414

Name	hadcm3n_o1zq_1980_40_008407821_2
Workunit	8558677
Created	1 Jan 2014, 16:54:21 UTC
Sent	1 Jan 2014, 16:54:27 UTC
Report deadline	3 Apr 2014, 0:21:38 UTC
Received	16 Jan 2014, 2:10:29 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	25 (0x00000019) Unknown error code
Computer ID	1308088
Run time	4 days 6 hours 17 min 16 sec
CPU time	4 days 5 hours 7 min 53 sec
Validate state	Invalid
Credit	6,220.80
Device peak FLOPS	4.09 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.2.33</core_client_version> <![CDATA[ <message> The drive cannot locate a specific area or track on the disk. (0x19) - exit code 25 (0x19) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2212, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 19:03:51 (6976): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 13:21:07 (7988): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=14356, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=13652, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6672, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7372, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3476, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
15 Jan 2014 22:25:58	1308088	16193414	hadcm3n_o1zq_1980_40_008407821_2	518,400	354,022	0.6829
14 Jan 2014 03:47:10	1308088	16193414	hadcm3n_o1zq_1980_40_008407821_2	492,480	334,517	0.6792
14 Jan 2014 00:41:10	1308088	16193414	hadcm3n_o1zq_1980_40_008407821_2	466,560	317,313	0.6801
13 Jan 2014 01:46:26	1308088	16193414	hadcm3n_o1zq_1980_40_008407821_2	440,640	301,187	0.6835
12 Jan 2014 20:39:59	1308088	16193414	hadcm3n_o1zq_1980_40_008407821_2	414,720	285,312	0.6880
11 Jan 2014 23:51:18	1308088	16193414	hadcm3n_o1zq_1980_40_008407821_2	388,800	267,886	0.6890
10 Jan 2014 03:40:54	1308088	16193414	hadcm3n_o1zq_1980_40_008407821_2	362,880	251,074	0.6919
09 Jan 2014 20:08:30	1308088	16193414	hadcm3n_o1zq_1980_40_008407821_2	336,960	235,011	0.6974
08 Jan 2014 02:44:04	1308088	16193414	hadcm3n_o1zq_1980_40_008407821_2	311,040	218,969	0.7040
07 Jan 2014 00:35:49	1308088	16193414	hadcm3n_o1zq_1980_40_008407821_2	285,120	201,806	0.7078
06 Jan 2014 18:23:28	1308088	16193414	hadcm3n_o1zq_1980_40_008407821_2	259,200	179,813	0.6937
05 Jan 2014 23:21:00	1308088	16193414	hadcm3n_o1zq_1980_40_008407821_2	233,280	163,520	0.7010
05 Jan 2014 03:18:49	1308088	16193414	hadcm3n_o1zq_1980_40_008407821_2	207,360	144,968	0.6991
04 Jan 2014 17:40:50	1308088	16193414	hadcm3n_o1zq_1980_40_008407821_2	181,440	128,947	0.7107
04 Jan 2014 01:37:58	1308088	16193414	hadcm3n_o1zq_1980_40_008407821_2	155,520	113,153	0.7276
03 Jan 2014 20:56:28	1308088	16193414	hadcm3n_o1zq_1980_40_008407821_2	129,600	96,606	0.7454
03 Jan 2014 02:24:13	1308088	16193414	hadcm3n_o1zq_1980_40_008407821_2	103,680	79,115	0.7631
02 Jan 2014 21:32:56	1308088	16193414	hadcm3n_o1zq_1980_40_008407821_2	77,760	61,801	0.7948
02 Jan 2014 04:59:35	1308088	16193414	hadcm3n_o1zq_1980_40_008407821_2	51,840	42,545	0.8207
01 Jan 2014 23:07:50	1308088	16193414	hadcm3n_o1zq_1980_40_008407821_2	25,920	21,603	0.8334