Task 16294117

Name	hadcm3n_81fh_1980_40_008459792_4
Workunit	8610648
Created	25 Feb 2014, 20:09:06 UTC
Sent	25 Feb 2014, 20:09:09 UTC
Report deadline	28 May 2014, 3:36:20 UTC
Received	31 Mar 2014, 16:54:44 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	193 (0x000000C1) EXIT_SIGNAL
Computer ID	1168291
Run time	21 days 2 hours 10 min 53 sec
CPU time	18 days 20 hours 20 min 41 sec
Validate state	Invalid
Credit	6,220.80
Device peak FLOPS	1.90 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.2.33</core_client_version> <![CDATA[ <message> (unknown error) - exit code 193 (0xc1) </message> <stderr_txt> 02:41:22 (4844): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 18:31:29 (1040): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3416, iMonCtr=1 Model crash detected, will try to restart... 18:37:27 (1148): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2128, iMonCtr=1 Model crash detected, will try to restart... 19:17:20 (4628): No heartbeat from core client for 30 sec - exiting 19:17:21 (4628): No heartbeat from core client for 30 sec - exiting 19:17:22 (4628): No heartbeat from core client for 30 sec - exiting 19:17:23 (4628): No heartbeat from core client for 30 sec - exiting 19:17:24 (4628): No heartbeat from core client for 30 sec - exiting 19:17:25 (4628): No heartbeat from core client for 30 sec - exiting 19:17:27 (4628): No heartbeat from core client for 30 sec - exiting 19:17:28 (4628): No heartbeat from core client for 30 sec - exiting 19:17:29 (4628): No heartbeat from core client for 30 sec - exiting 19:17:30 (4628): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... BUFFIN: C I/O Error feof - Unit 63 - Return code = 16 BUFFIN: C I/O Error feof - Unit 64 - Return code = 16 BUFFIN: C I/O Error feof - Unit 65 - Return code = 16 BUFFIN: C I/O Error feof - Unit 66 - Return code = 16 BUFFIN: C I/O Error feof - Unit 67 - Return code = 16 BUFFIN: C I/O Error feof - Unit 68 - Return code = 16 BUFFIN: C I/O Error feof - Unit 69 - Return code = 16 Error converting file to netcdf: dataout/81fhko.pjj6c10 Error converting file to netcdf: dataout/81fhko.pij6c10 Error converting file to netcdf: dataout/81fhko.pfj6c10 Error converting file to netcdf: dataout/81fhka.phj6c10 Error converting file to netcdf: dataout/81fhka.pgj6c10 Error converting file to netcdf: dataout/81fhka.pej6c10 Error converting file to netcdf: dataout/81fhka.pdj6c10 Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2980, iMonCtr=1 Model crash detected, will try to restart... 18:25:40 (4360): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 18:25:41 (4360): No heartbeat from core client for 30 sec - exiting 18:25:42 (4360): No heartbeat from core client for 30 sec - exiting 00:13:34 (3976): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3684, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3688, iMonCtr=1 Model crash detected, will try to restart... 06:07:31 (1532): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 06:07:32 (1532): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... Signal 11 received, exiting... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
31 Mar 2014 03:51:27	1168291	16294117	hadcm3n_81fh_1980_40_008459792_4	518,400	1,628,435	3.1413
30 Mar 2014 01:35:53	1168291	16294117	hadcm3n_81fh_1980_40_008459792_4	492,480	1,546,586	3.1404
28 Mar 2014 23:10:18	1168291	16294117	hadcm3n_81fh_1980_40_008459792_4	466,560	1,459,653	3.1285
26 Mar 2014 23:37:50	1168291	16294117	hadcm3n_81fh_1980_40_008459792_4	440,640	1,378,935	3.1294
24 Mar 2014 19:04:16	1168291	16294117	hadcm3n_81fh_1980_40_008459792_4	414,720	1,298,985	3.1322
23 Mar 2014 07:48:42	1168291	16294117	hadcm3n_81fh_1980_40_008459792_4	388,800	1,223,692	3.1474
22 Mar 2014 08:24:57	1168291	16294117	hadcm3n_81fh_1980_40_008459792_4	362,880	1,148,335	3.1645
20 Mar 2014 20:53:10	1168291	16294117	hadcm3n_81fh_1980_40_008459792_4	336,960	1,069,262	3.1733
18 Mar 2014 18:19:40	1168291	16294117	hadcm3n_81fh_1980_40_008459792_4	311,040	986,546	3.1718
16 Mar 2014 18:21:29	1168291	16294117	hadcm3n_81fh_1980_40_008459792_4	285,120	905,899	3.1773
15 Mar 2014 19:09:32	1168291	16294117	hadcm3n_81fh_1980_40_008459792_4	259,200	828,604	3.1968
13 Mar 2014 20:16:24	1168291	16294117	hadcm3n_81fh_1980_40_008459792_4	233,280	743,784	3.1884
11 Mar 2014 18:47:56	1168291	16294117	hadcm3n_81fh_1980_40_008459792_4	207,360	664,853	3.2063
09 Mar 2014 16:41:55	1168291	16294117	hadcm3n_81fh_1980_40_008459792_4	181,440	583,110	3.2138
08 Mar 2014 15:00:25	1168291	16294117	hadcm3n_81fh_1980_40_008459792_4	155,520	498,610	3.2061
06 Mar 2014 22:50:01	1168291	16294117	hadcm3n_81fh_1980_40_008459792_4	129,600	412,978	3.1866
04 Mar 2014 20:34:44	1168291	16294117	hadcm3n_81fh_1980_40_008459792_4	103,680	332,338	3.2054
02 Mar 2014 18:15:20	1168291	16294117	hadcm3n_81fh_1980_40_008459792_4	77,760	246,319	3.1677
01 Mar 2014 16:49:35	1168291	16294117	hadcm3n_81fh_1980_40_008459792_4	51,840	161,560	3.1165
28 Feb 2014 03:50:34	1168291	16294117	hadcm3n_81fh_1980_40_008459792_4	25,920	80,095	3.0901