Task 13116608

Name	hadcm3n_yi52_1900_40_007356368_1
Workunit	7553798
Created	6 Jul 2011, 14:46:07 UTC
Sent	9 Jul 2011, 19:21:20 UTC
Report deadline	9 Oct 2011, 2:48:31 UTC
Received	19 Aug 2011, 18:05:31 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	-226 (0xFFFFFF1E) ERR_TOO_MANY_EXITS
Computer ID	1127745
Run time	12 days 22 hours 57 min 24 sec
CPU time	12 days 5 hours 23 min 9 sec
Validate state	Invalid
Credit	7,776.00
Device peak FLOPS	0.64 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.13.1</core_client_version> <![CDATA[ <message> too many exit(0)s </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 03:55:54 (3824): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3812, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3360, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3696, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3696, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3696, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3696, iMonCtr=1 Model crash detected, will try to restart... BUFFIN: C I/O Error feof - Unit 63 - Return code = 16 BUFFIN: C I/O Error feof - Unit 64 - Return code = 16 BUFFIN: C I/O Error feof - Unit 65 - Return code = 16 BUFFIN: C I/O Error feof - Unit 66 - Return code = 16 BUFFIN: C I/O Error feof - Unit 67 - Return code = 16 BUFFIN: C I/O Error feof - Unit 68 - Return code = 16 BUFFIN: C I/O Error feof - Unit 69 - Return code = 16 Error converting file to netcdf: dataout/yi52ko.pjc2c10 Error converting file to netcdf: dataout/yi52ko.pic2c10 Error converting file to netcdf: dataout/yi52ko.pfc2c10 Error converting file to netcdf: dataout/yi52ka.phc2c10 Error converting file to netcdf: dataout/yi52ka.pgc2c10 Error converting file to netcdf: dataout/yi52ka.pec2c10 Error converting file to netcdf: dataout/yi52ka.pdc2c10 Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4352, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... 11:45:00 (4644): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
19 Aug 2011 12:37:10	1127745	13116608	hadcm3n_yi52_1900_40_007356368_1	648,000	1,039,228	1.6037
08 Aug 2011 05:58:26	1127745	13116608	hadcm3n_yi52_1900_40_007356368_1	622,080	998,533	1.6052
07 Aug 2011 17:00:35	1127745	13116608	hadcm3n_yi52_1900_40_007356368_1	596,160	958,776	1.6083
04 Aug 2011 22:46:49	1127745	13116608	hadcm3n_yi52_1900_40_007356368_1	570,240	919,217	1.6120
03 Aug 2011 22:21:30	1127745	13116608	hadcm3n_yi52_1900_40_007356368_1	544,320	878,665	1.6142
01 Aug 2011 15:32:49	1127745	13116608	hadcm3n_yi52_1900_40_007356368_1	518,400	839,051	1.6185
31 Jul 2011 15:40:16	1127745	13116608	hadcm3n_yi52_1900_40_007356368_1	492,480	799,442	1.6233
30 Jul 2011 16:25:17	1127745	13116608	hadcm3n_yi52_1900_40_007356368_1	466,560	759,958	1.6289
29 Jul 2011 17:42:25	1127745	13116608	hadcm3n_yi52_1900_40_007356368_1	440,640	720,511	1.6351
28 Jul 2011 21:52:24	1127745	13116608	hadcm3n_yi52_1900_40_007356368_1	414,720	681,009	1.6421
28 Jul 2011 10:21:10	1127745	13116608	hadcm3n_yi52_1900_40_007356368_1	388,800	641,355	1.6496
27 Jul 2011 13:09:04	1127745	13116608	hadcm3n_yi52_1900_40_007356368_1	362,880	602,294	1.6598
26 Jul 2011 15:30:28	1127745	13116608	hadcm3n_yi52_1900_40_007356368_1	336,960	562,828	1.6703
25 Jul 2011 22:52:47	1127745	13116608	hadcm3n_yi52_1900_40_007356368_1	311,040	522,688	1.6805
25 Jul 2011 22:20:54	1127745	13116608	hadcm3n_yi52_1900_40_007356368_1	285,120	482,488	1.6922
25 Jul 2011 21:42:58	1127745	13116608	hadcm3n_yi52_1900_40_007356368_1	259,200	443,310	1.7103
25 Jul 2011 20:40:04	1127745	13116608	hadcm3n_yi52_1900_40_007356368_1	233,280	403,560	1.7299
25 Jul 2011 19:38:12	1127745	13116608	hadcm3n_yi52_1900_40_007356368_1	207,360	362,309	1.7472
25 Jul 2011 19:30:09	1127745	13116608	hadcm3n_yi52_1900_40_007356368_1	181,440	320,889	1.7686
25 Jul 2011 19:29:05	1127745	13116608	hadcm3n_yi52_1900_40_007356368_1	155,520	279,211	1.7953