Task 15927114

Name	hadcm3n_4fxq_1980_40_008405722_0
Workunit	8556578
Created	20 Aug 2013, 3:26:39 UTC
Sent	20 Aug 2013, 20:27:55 UTC
Report deadline	20 Nov 2013, 3:55:06 UTC
Received	10 Nov 2013, 14:17:58 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	25 (0x00000019) Unknown error code
Computer ID	1218285
Run time	14 days 9 hours 24 min 9 sec
CPU time	12 days 21 hours 24 min 1 sec
Validate state	Invalid
Credit	12,130.56
Device peak FLOPS	3.53 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.64</core_client_version> <![CDATA[ <message> L'unità non riesce a trovare un'area o una traccia del disco specifica. (0x19) - exit code 25 (0x19) </message> <stderr_txt> Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7960, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5356, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4680, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6076, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4880, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6588, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4808, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 22:59:57 (5884): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6108, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... BUFFIN: C I/O Error feof - Unit 63 - Return code = 16 BUFFIN: C I/O Error feof - Unit 64 - Return code = 16 BUFFIN: C I/O Error feof - Unit 65 - Return code = 16 BUFFIN: C I/O Error feof - Unit 66 - Return code = 16 BUFFIN: C I/O Error feof - Unit 67 - Return code = 16 BUFFIN: C I/O Error feof - Unit 68 - Return code = 16 BUFFIN: C I/O Error feof - Unit 69 - Return code = 16 Error converting file to netcdf: dataout/4fxqko.pjj6c10 Error converting file to netcdf: dataout/4fxqko.pij6c10 Error converting file to netcdf: dataout/4fxqko.pfj6c10 Error converting file to netcdf: dataout/4fxqka.phj6c10 Error converting file to netcdf: dataout/4fxqka.pgj6c10 Error converting file to netcdf: dataout/4fxqka.pej6c10 Error converting file to netcdf: dataout/4fxqka.pdj6c10 Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5256, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6900, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2532, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7016, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5888, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... 00:05:00 (5212): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 22:15:37 (3976): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4212, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4736, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7056, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... 15:30:25 (5532): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5772, iMonCtr=1 Model crash detected, will try to restart... 17:29:52 (5624): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 20:24:05 (6508): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7864, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
09 Nov 2013 15:17:41	1218285	15927114	hadcm3n_4fxq_1980_40_008405722_0	1,010,880	1,088,482	1.0768
03 Nov 2013 22:30:25	1218285	15927114	hadcm3n_4fxq_1980_40_008405722_0	984,960	1,060,278	1.0765
03 Nov 2013 12:18:51	1218285	15927114	hadcm3n_4fxq_1980_40_008405722_0	959,040	1,031,979	1.0761
02 Nov 2013 18:07:04	1218285	15927114	hadcm3n_4fxq_1980_40_008405722_0	933,120	1,004,080	1.0760
01 Nov 2013 22:09:00	1218285	15927114	hadcm3n_4fxq_1980_40_008405722_0	907,200	976,305	1.0762
01 Nov 2013 13:13:54	1218285	15927114	hadcm3n_4fxq_1980_40_008405722_0	881,280	948,433	1.0762
27 Oct 2013 18:11:54	1218285	15927114	hadcm3n_4fxq_1980_40_008405722_0	855,360	920,449	1.0761
27 Oct 2013 09:43:44	1218285	15927114	hadcm3n_4fxq_1980_40_008405722_0	829,440	892,377	1.0759
26 Oct 2013 15:14:03	1218285	15927114	hadcm3n_4fxq_1980_40_008405722_0	803,520	864,270	1.0756
24 Oct 2013 21:47:41	1218285	15927114	hadcm3n_4fxq_1980_40_008405722_0	777,600	836,478	1.0757
22 Oct 2013 20:41:09	1218285	15927114	hadcm3n_4fxq_1980_40_008405722_0	751,680	808,888	1.0761
20 Oct 2013 17:47:40	1218285	15927114	hadcm3n_4fxq_1980_40_008405722_0	725,760	781,090	1.0762
20 Oct 2013 09:19:42	1218285	15927114	hadcm3n_4fxq_1980_40_008405722_0	699,840	753,211	1.0763
19 Oct 2013 17:47:46	1218285	15927114	hadcm3n_4fxq_1980_40_008405722_0	673,920	725,381	1.0764
19 Oct 2013 10:05:42	1218285	15927114	hadcm3n_4fxq_1980_40_008405722_0	648,000	697,671	1.0767
15 Oct 2013 18:09:13	1218285	15927114	hadcm3n_4fxq_1980_40_008405722_0	622,080	669,987	1.0770
14 Oct 2013 19:17:43	1218285	15927114	hadcm3n_4fxq_1980_40_008405722_0	596,160	642,346	1.0775
13 Oct 2013 17:08:04	1218285	15927114	hadcm3n_4fxq_1980_40_008405722_0	570,240	614,364	1.0774
12 Oct 2013 11:04:26	1218285	15927114	hadcm3n_4fxq_1980_40_008405722_0	544,320	586,499	1.0775
07 Oct 2013 21:01:33	1218285	15927114	hadcm3n_4fxq_1980_40_008405722_0	518,400	558,622	1.0776