Task 12740674

Name	hadcm3n_o3ei_1900_40_007199741_0
Workunit	7398021
Created	28 Mar 2011, 14:06:48 UTC
Sent	31 Mar 2011, 7:58:04 UTC
Report deadline	30 Jun 2011, 15:25:15 UTC
Received	5 Jun 2011, 0:48:14 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1106775
Run time	41 days 4 hours 46 min 8 sec
CPU time	38 days 7 hours 7 min 31 sec
Validate state	Invalid
Credit	10,886.40
Device peak FLOPS	2.03 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.58</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> 13:01:05 (172): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 13:13:50 (204): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 13:41:10 (184): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 13:10:27 (180): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 11:31:46 (176): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 13:15:08 (176): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... forrtl: The requested operation cannot be performed on a file with a user-mapped section open. Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 00:46:58 (164): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 00:47:06 (164): No heartbeat from core client for 30 sec - exiting 00:47:07 (164): No heartbeat from core client for 30 sec - exiting 00:47:08 (164): No heartbeat from core client for 30 sec - exiting 00:47:10 (164): No heartbeat from core client for 30 sec - exiting 00:47:11 (164): No heartbeat from core client for 30 sec - exiting 00:47:12 (164): No heartbeat from core client for 30 sec - exiting 00:47:13 (164): No heartbeat from core client for 30 sec - exiting 00:47:14 (164): No heartbeat from core client for 30 sec - exiting 00:47:15 (164): No heartbeat from core client for 30 sec - exiting 00:47:16 (164): No heartbeat from core client for 30 sec - exiting 00:59:56 (188): No heartbeat from core client for 30 sec - exiting 00:59:57 (188): No heartbeat from core client for 30 sec - exiting 00:59:58 (188): No heartbeat from core client for 30 sec - exiting 00:59:59 (188): No heartbeat from core client for 30 sec - exiting 01:00:00 (188): No heartbeat from core client for 30 sec - exiting 01:00:02 (188): No heartbeat from core client for 30 sec - exiting 01:00:03 (188): No heartbeat from core client for 30 sec - exiting 01:00:04 (188): No heartbeat from core client for 30 sec - exiting 01:00:05 (188): No heartbeat from core client for 30 sec - exiting 01:00:06 (188): No heartbeat from core client for 30 sec - exiting 01:00:07 (188): No heartbeat from core client for 30 sec - exiting 01:00:08 (188): No heartbeat from core client for 30 sec - exiting 01:00:09 (188): No heartbeat from core client for 30 sec - exiting 01:00:10 (188): No heartbeat from core client for 30 sec - exiting 01:00:11 (188): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... BUFFIN: C I/O Error ferror - Unit 116 - Return code = 32 Model crashed: READHEAD: I/O error tmp/pipe_dummy 2048 BUFFIN: C I/O Error ferror - Unit 116 - Return code = 32 Model crashed: READHEAD: I/O error tmp/pipe_dummy 2048 BUFFIN: C I/O Error ferror - Unit 116 - Return code = 32 Model crashed: READHEAD: I/O error tmp/pipe_dummy 2048 BUFFIN: C I/O Error ferror - Unit 116 - Return code = 32 Model crashed: READHEAD: I/O error tmp/pipe_dummy 2048 BUFFIN: C I/O Error ferror - Unit 116 - Return code = 32 Model crashed: READHEAD: I/O error tmp/pipe_dummy 2048 BUFFIN: C I/O Error ferror - Unit 116 - Return code = 32 Model crashed: READHEAD: I/O error tmp/pipe_dummy 2048 Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
23 May 2011 04:00:22	1106775	12740674	hadcm3n_o3ei_1900_40_007199741_0	907,200	3,286,735	3.6229
22 May 2011 02:45:40	1106775	12740674	hadcm3n_o3ei_1900_40_007199741_0	881,280	3,198,147	3.6290
21 May 2011 01:25:16	1106775	12740674	hadcm3n_o3ei_1900_40_007199741_0	855,360	3,109,226	3.6350
20 May 2011 00:21:24	1106775	12740674	hadcm3n_o3ei_1900_40_007199741_0	829,440	3,020,863	3.6421
18 May 2011 23:15:13	1106775	12740674	hadcm3n_o3ei_1900_40_007199741_0	803,520	2,932,601	3.6497
17 May 2011 22:01:50	1106775	12740674	hadcm3n_o3ei_1900_40_007199741_0	777,600	2,843,797	3.6571
16 May 2011 20:48:45	1106775	12740674	hadcm3n_o3ei_1900_40_007199741_0	751,680	2,754,873	3.6650
14 May 2011 03:35:57	1106775	12740674	hadcm3n_o3ei_1900_40_007199741_0	725,760	2,662,415	3.6685
12 May 2011 20:43:32	1106775	12740674	hadcm3n_o3ei_1900_40_007199741_0	699,840	2,566,679	3.6675
11 May 2011 13:23:37	1106775	12740674	hadcm3n_o3ei_1900_40_007199741_0	673,920	2,469,873	3.6649
10 May 2011 06:59:40	1106775	12740674	hadcm3n_o3ei_1900_40_007199741_0	648,000	2,373,587	3.6629
09 May 2011 00:09:50	1106775	12740674	hadcm3n_o3ei_1900_40_007199741_0	622,080	2,277,397	3.6609
07 May 2011 17:03:31	1106775	12740674	hadcm3n_o3ei_1900_40_007199741_0	596,160	2,180,748	3.6580
06 May 2011 09:30:20	1106775	12740674	hadcm3n_o3ei_1900_40_007199741_0	570,240	2,084,829	3.6561
05 May 2011 03:00:04	1106775	12740674	hadcm3n_o3ei_1900_40_007199741_0	544,320	1,988,306	3.6528
03 May 2011 23:30:57	1106775	12740674	hadcm3n_o3ei_1900_40_007199741_0	518,400	1,891,233	3.6482
23 Apr 2011 20:07:51	1106775	12740674	hadcm3n_o3ei_1900_40_007199741_0	492,480	1,794,763	3.6443
22 Apr 2011 13:13:22	1106775	12740674	hadcm3n_o3ei_1900_40_007199741_0	466,560	1,699,033	3.6416
21 Apr 2011 04:58:54	1106775	12740674	hadcm3n_o3ei_1900_40_007199741_0	440,640	1,602,368	3.6365
20 Apr 2011 16:00:36	1106775	12740674	hadcm3n_o3ei_1900_40_007199741_0	414,720	1,505,613	3.6304