Task 12928010

Name	hadcm3n_o4r4_1940_40_007267240_0
Workunit	7465480
Created	3 Jun 2011, 2:12:07 UTC
Sent	3 Jun 2011, 2:12:13 UTC
Report deadline	2 Sep 2011, 9:39:24 UTC
Received	4 Jul 2011, 20:02:06 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1103902
Run time	28 days 2 hours 40 min 19 sec
CPU time	14 days 1 hours 28 min 48 sec
Validate state	Invalid
Credit	6,220.80
Device peak FLOPS	1.64 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.58</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2460, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... 18:08:20 (3104): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 18:08:21 (3104): No heartbeat from core client for 30 sec - exiting 18:08:22 (3104): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5780, iMonCtr=1 Model crash detected, will try to restart... 00:48:51 (1176): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 00:48:52 (1176): No heartbeat from core client for 30 sec - exiting 22:50:39 (3296): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 22:50:41 (3296): No heartbeat from core client for 30 sec - exiting 22:50:42 (3296): No heartbeat from core client for 30 sec - exiting 22:50:43 (3296): No heartbeat from core client for 30 sec - exiting 22:50:44 (3296): No heartbeat from core client for 30 sec - exiting 22:50:45 (3296): No heartbeat from core client for 30 sec - exiting 22:50:46 (3296): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Model crashed: TEMPHIST: Failed in OPEN of history file tmp/pipe_dummy 2048 15:48:31 (5696): No heartbeat from core client for 30 sec - exiting 15:48:32 (5696): No heartbeat from core client for 30 sec - exiting 15:48:33 (5696): No heartbeat from core client for 30 sec - exiting 15:48:34 (5696): No heartbeat from core client for 30 sec - exiting 15:48:35 (5696): No heartbeat from core client for 30 sec - exiting 15:48:36 (5696): No heartbeat from core client for 30 sec - exiting 15:48:37 (5696): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... cpdnmonitor: cannot open input file D:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o4r4_1940_40_007267240/dataout/atmos_restart.day after 11 attempts cpdnmonitor: cannot open input file D:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o4r4_1940_40_007267240/dataout/ocean_restart.day after 11 attempts Model crashed: READ_FLH: I/O error tmp/pipe_dummy 2048 cpdnmonitor: cannot open input file D:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o4r4_1940_40_007267240/dataout/atmos_restart.day after 11 attempts cpdnmonitor: cannot open input file D:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o4r4_1940_40_007267240/dataout/ocean_restart.day after 11 attempts Model crashed: READ_FLH: I/O error tmp/pipe_dummy 2048 cpdnmonitor: cannot open input file D:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o4r4_1940_40_007267240/dataout/atmos_restart.day after 11 attempts cpdnmonitor: cannot open input file D:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o4r4_1940_40_007267240/dataout/ocean_restart.day after 11 attempts Model crashed: READ_FLH: I/O error tmp/pipe_dummy 2048 cpdnmonitor: cannot open input file D:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o4r4_1940_40_007267240/dataout/atmos_restart.day after 11 attempts cpdnmonitor: cannot open input file D:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o4r4_1940_40_007267240/dataout/ocean_restart.day after 11 attempts Model crashed: READ_FLH: I/O error tmp/pipe_dummy 2048 cpdnmonitor: cannot open input file D:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o4r4_1940_40_007267240/dataout/atmos_restart.day after 11 attempts cpdnmonitor: cannot open input file D:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o4r4_1940_40_007267240/dataout/ocean_restart.day after 11 attempts Model crashed: READ_FLH: I/O error tmp/pipe_dummy 2048 cpdnmonitor: cannot open input file D:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o4r4_1940_40_007267240/dataout/atmos_restart.day after 11 attempts cpdnmonitor: cannot open input file D:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o4r4_1940_40_007267240/dataout/ocean_restart.day after 11 attempts Model crashed: READ_FLH: I/O error tmp/pipe_dummy 2048 Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
04 Jul 2011 20:06:52	1103902	12928010	hadcm3n_o4r4_1940_40_007267240_0	518,400	1,215,206	2.3441
02 Jul 2011 12:12:55	1103902	12928010	hadcm3n_o4r4_1940_40_007267240_0	492,480	1,054,023	2.1402
30 Jun 2011 22:59:14	1103902	12928010	hadcm3n_o4r4_1940_40_007267240_0	466,560	1,890,186	4.0513
29 Jun 2011 10:04:28	1103902	12928010	hadcm3n_o4r4_1940_40_007267240_0	440,640	1,770,303	4.0176
27 Jun 2011 10:19:26	1103902	12928010	hadcm3n_o4r4_1940_40_007267240_0	414,720	1,617,235	3.8996
25 Jun 2011 17:12:30	1103902	12928010	hadcm3n_o4r4_1940_40_007267240_0	388,800	1,482,383	3.8127
24 Jun 2011 07:10:04	1103902	12928010	hadcm3n_o4r4_1940_40_007267240_0	362,880	1,372,730	3.7829
22 Jun 2011 21:27:52	1103902	12928010	hadcm3n_o4r4_1940_40_007267240_0	336,960	1,262,276	3.7461
21 Jun 2011 10:19:56	1103902	12928010	hadcm3n_o4r4_1940_40_007267240_0	311,040	1,147,000	3.6876
19 Jun 2011 23:35:53	1103902	12928010	hadcm3n_o4r4_1940_40_007267240_0	285,120	1,032,745	3.6221
19 Jun 2011 22:28:19	1103902	12928010	hadcm3n_o4r4_1940_40_007267240_0	259,200	928,899	3.5837
17 Jun 2011 09:00:40	1103902	12928010	hadcm3n_o4r4_1940_40_007267240_0	233,280	825,016	3.5366
15 Jun 2011 23:47:36	1103902	12928010	hadcm3n_o4r4_1940_40_007267240_0	207,360	721,530	3.4796
14 Jun 2011 14:39:01	1103902	12928010	hadcm3n_o4r4_1940_40_007267240_0	181,440	617,074	3.4010
13 Jun 2011 08:29:00	1103902	12928010	hadcm3n_o4r4_1940_40_007267240_0	155,520	522,979	3.3628
12 Jun 2011 04:58:34	1103902	12928010	hadcm3n_o4r4_1940_40_007267240_0	129,600	436,213	3.3658
11 Jun 2011 01:46:48	1103902	12928010	hadcm3n_o4r4_1940_40_007267240_0	103,680	350,536	3.3809
09 Jun 2011 20:46:54	1103902	12928010	hadcm3n_o4r4_1940_40_007267240_0	77,760	259,359	3.3354
08 Jun 2011 15:51:13	1103902	12928010	hadcm3n_o4r4_1940_40_007267240_0	51,840	168,777	3.2557
07 Jun 2011 10:45:40	1103902	12928010	hadcm3n_o4r4_1940_40_007267240_0	25,920	77,838	3.0030