Task 16068987

Name	hadcm3n_83o9_1980_40_008462700_4
Workunit	8613556
Created	17 Oct 2013, 15:39:42 UTC
Sent	17 Oct 2013, 15:39:51 UTC
Report deadline	16 Jan 2014, 23:07:02 UTC
Received	9 Nov 2013, 12:22:36 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1275548
Run time	9 days 1 hours 26 min 19 sec
CPU time	7 days 8 hours 52 min 10 sec
Validate state	Invalid
Credit	5,909.76
Device peak FLOPS	2.99 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.64</core_client_version> <![CDATA[ <message> El dispositivo no reconoce el comando. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... 18:00:46 (1456): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 23:22:55 (3156): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 23:44:07 (5124): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 23:14:00 (3632): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 22:59:29 (5104): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 23:40:38 (4192): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 23:43:39 (3056): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 23:46:42 (6684): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 22:58:34 (6676): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 23:10:41 (2716): No heartbeat from core client for 30 sec - exiting 23:10:42 (2716): No heartbeat from core client for 30 sec - exiting 23:10:43 (2716): No heartbeat from core client for 30 sec - exiting 23:10:44 (2716): No heartbeat from core client for 30 sec - exiting 23:10:45 (2716): No heartbeat from core client for 30 sec - exiting 23:10:46 (2716): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CBUFFIN: C I/O Error feof - Unit 63 - Return code = 16 BUFFIN: C I/O Error feof - Unit 64 - Return code = 16 BUFFIN: C I/O Error feof - Unit 65 - Return code = 16 BUFFIN: C I/O Error feof - Unit 66 - Return code = 16 BUFFIN: C I/O Error feof - Unit 67 - Return code = 16 BUFFIN: C I/O Error feof - Unit 68 - Return code = 16 BUFFIN: C I/O Error feof - Unit 69 - Return code = 16 Error converting file to netcdf: dataout/83o9ko.pjj7c10 Error converting file to netcdf: dataout/83o9ko.pij7c10 Error converting file to netcdf: dataout/83o9ko.pfj7c10 Error converting file to netcdf: dataout/83o9ka.phj7c10 Error converting file to netcdf: dataout/83o9ka.pgj7c10 Error converting file to netcdf: dataout/83o9ka.pej7c10 Error converting file to netcdf: dataout/83o9ka.pdj7c10 Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4368, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4368, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4368, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4368, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4368, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4368, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
07 Nov 2013 12:56:29	1275548	16068987	hadcm3n_83o9_1980_40_008462700_4	492,480	619,245	1.2574
05 Nov 2013 19:43:09	1275548	16068987	hadcm3n_83o9_1980_40_008462700_4	466,560	586,633	1.2574
05 Nov 2013 09:33:17	1275548	16068987	hadcm3n_83o9_1980_40_008462700_4	440,640	554,305	1.2580
04 Nov 2013 12:40:03	1275548	16068987	hadcm3n_83o9_1980_40_008462700_4	414,720	521,604	1.2577
03 Nov 2013 14:47:05	1275548	16068987	hadcm3n_83o9_1980_40_008462700_4	388,800	488,909	1.2575
01 Nov 2013 19:33:10	1275548	16068987	hadcm3n_83o9_1980_40_008462700_4	362,880	455,548	1.2554
31 Oct 2013 17:56:45	1275548	16068987	hadcm3n_83o9_1980_40_008462700_4	336,960	422,915	1.2551
30 Oct 2013 11:29:26	1275548	16068987	hadcm3n_83o9_1980_40_008462700_4	311,040	390,289	1.2548
29 Oct 2013 15:51:12	1275548	16068987	hadcm3n_83o9_1980_40_008462700_4	285,120	357,837	1.2550
28 Oct 2013 17:44:09	1275548	16068987	hadcm3n_83o9_1980_40_008462700_4	259,200	325,289	1.2550
27 Oct 2013 21:33:56	1275548	16068987	hadcm3n_83o9_1980_40_008462700_4	233,280	292,550	1.2541
26 Oct 2013 17:51:53	1275548	16068987	hadcm3n_83o9_1980_40_008462700_4	207,360	259,977	1.2537
25 Oct 2013 17:54:22	1275548	16068987	hadcm3n_83o9_1980_40_008462700_4	181,440	227,689	1.2549
24 Oct 2013 18:00:02	1275548	16068987	hadcm3n_83o9_1980_40_008462700_4	155,520	195,335	1.2560
23 Oct 2013 14:34:14	1275548	16068987	hadcm3n_83o9_1980_40_008462700_4	129,600	162,858	1.2566
22 Oct 2013 15:15:29	1275548	16068987	hadcm3n_83o9_1980_40_008462700_4	103,680	130,677	1.2604
21 Oct 2013 15:44:17	1275548	16068987	hadcm3n_83o9_1980_40_008462700_4	77,760	98,525	1.2670
20 Oct 2013 18:18:02	1275548	16068987	hadcm3n_83o9_1980_40_008462700_4	51,840	66,052	1.2742
18 Oct 2013 19:35:22	1275548	16068987	hadcm3n_83o9_1980_40_008462700_4	25,920	32,400	1.2500