Task 13121140

Name	hadcm3n_yjw0_1900_40_007358634_1
Workunit	7556064
Created	6 Jul 2011, 15:01:05 UTC
Sent	8 Jul 2011, 6:48:30 UTC
Report deadline	7 Oct 2011, 14:15:41 UTC
Received	25 Jul 2011, 4:46:12 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	959555
Run time	11 days 4 hours 14 min 18 sec
CPU time	4 days 5 hours 21 min 32 sec
Validate state	Invalid
Credit	5,287.68
Device peak FLOPS	3.18 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.58</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 09:39:42 (3108): No heartbeat from core client for 30 sec - exiting 09:39:43 (3108): No heartbeat from core client for 30 sec - exiting 09:39:44 (3108): No heartbeat from core client for 30 sec - exiting 09:39:46 (3108): No heartbeat from core client for 30 sec - exiting 09:39:47 (3108): No heartbeat from core client for 30 sec - exiting 09:39:48 (3108): No heartbeat from core client for 30 sec - exiting 09:39:49 (3108): No heartbeat from core client for 30 sec - exiting 09:39:50 (3108): No heartbeat from core client for 30 sec - exiting 09:39:51 (3108): No heartbeat from core client for 30 sec - exiting 09:39:52 (3108): No heartbeat from core client for 30 sec - exiting 09:39:53 (3108): No heartbeat from core client for 30 sec - exiting 09:39:54 (3108): No heartbeat from core client for 30 sec - exiting 09:39:55 (3108): No heartbeat from core client for 30 sec - exiting 09:39:56 (3108): No heartbeat from core client for 30 sec - exiting 09:39:58 (3108): No heartbeat from core client for 30 sec - exiting 09:39:59 (3108): No heartbeat from core client for 30 sec - exiting 09:40:00 (3108): No heartbeat from core client for 30 sec - exiting 09:40:01 (3108): No heartbeat from core client for 30 sec - exiting 09:40:02 (3108): No heartbeat from core client for 30 sec - exiting 09:40:03 (3108): No heartbeat from core client for 30 sec - exiting 09:40:04 (3108): No heartbeat from core client for 30 sec - exiting 09:40:05 (3108): No heartbeat from core client for 30 sec - exiting 09:40:06 (3108): No heartbeat from core client for 30 sec - exiting 09:40:07 (3108): No heartbeat from core client for 30 sec - exiting 09:40:08 (3108): No heartbeat from core client for 30 sec - exiting 09:40:10 (3108): No heartbeat from core client for 30 sec - exiting 09:40:11 (3108): No heartbeat from core client for 30 sec - exiting 09:40:12 (3108): No heartbeat from core client for 30 sec - exiting 09:40:13 (3108): No heartbeat from core client for 30 sec - exiting 09:40:14 (3108): No heartbeat from core client for 30 sec - exiting 09:40:15 (3108): No heartbeat from core client for 30 sec - exiting 09:40:16 (3108): No heartbeat from core client for 30 sec - exiting 09:40:17 (3108): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 forrtl: There is not enough space on the disk. 19:05:43 (3664): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITHEAD: I/O error tmp/pipe_dummy 2048 forrtl: There is not enough space on the disk. 08:47:43 (2908): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeaCPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
25 Jul 2011 22:26:31	959555	13121140	hadcm3n_yjw0_1900_40_007358634_1	440,640	367,500	0.8340
25 Jul 2011 21:53:23	959555	13121140	hadcm3n_yjw0_1900_40_007358634_1	414,720	834,464	2.0121
25 Jul 2011 20:49:53	959555	13121140	hadcm3n_yjw0_1900_40_007358634_1	388,800	775,733	1.9952
25 Jul 2011 20:22:13	959555	13121140	hadcm3n_yjw0_1900_40_007358634_1	362,880	717,037	1.9760
25 Jul 2011 19:02:26	959555	13121140	hadcm3n_yjw0_1900_40_007358634_1	336,960	658,267	1.9535
25 Jul 2011 19:02:26	959555	13121140	hadcm3n_yjw0_1900_40_007358634_1	311,040	599,546	1.9276
25 Jul 2011 19:02:26	959555	13121140	hadcm3n_yjw0_1900_40_007358634_1	285,120	540,727	1.8965
25 Jul 2011 18:48:16	959555	13121140	hadcm3n_yjw0_1900_40_007358634_1	259,200	482,073	1.8598
25 Jul 2011 18:01:55	959555	13121140	hadcm3n_yjw0_1900_40_007358634_1	233,280	423,387	1.8149
25 Jul 2011 17:36:28	959555	13121140	hadcm3n_yjw0_1900_40_007358634_1	207,360	364,905	1.7598
25 Jul 2011 17:21:58	959555	13121140	hadcm3n_yjw0_1900_40_007358634_1	181,440	344,288	1.8975
25 Jul 2011 17:21:58	959555	13121140	hadcm3n_yjw0_1900_40_007358634_1	155,520	295,518	1.9002
25 Jul 2011 17:21:58	959555	13121140	hadcm3n_yjw0_1900_40_007358634_1	129,600	246,694	1.9035
25 Jul 2011 17:21:58	959555	13121140	hadcm3n_yjw0_1900_40_007358634_1	103,680	197,936	1.9091
25 Jul 2011 17:21:58	959555	13121140	hadcm3n_yjw0_1900_40_007358634_1	77,760	149,059	1.9169
25 Jul 2011 17:21:57	959555	13121140	hadcm3n_yjw0_1900_40_007358634_1	51,840	99,067	1.9110
25 Jul 2011 17:21:57	959555	13121140	hadcm3n_yjw0_1900_40_007358634_1	25,920	49,633	1.9149