Task 15582383

Name	hadcm3n_o3bl_2140_40_008269551_2
Workunit	8424675
Created	4 Feb 2013, 0:07:21 UTC
Sent	4 Feb 2013, 0:07:31 UTC
Report deadline	6 May 2013, 7:34:42 UTC
Received	13 Feb 2013, 20:53:04 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1134660
Run time	8 days 14 hours 40 min 3 sec
CPU time	8 days 13 hours 9 min 17 sec
Validate state	Invalid
Credit	6,220.80
Device peak FLOPS	2.85 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4584, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 10:17:37 (5844): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 10:17:38 (5844): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... MainError: 07:50:48 PM No files match the supplied pattern. MainError: 07:50:49 PM No files match the supplied pattern. 15:51:22 (2200): No heartbeat from core client for 30 sec - exiting 15:51:23 (2200): No heartbeat from core client for 30 sec - exiting 15:51:24 (2200): No heartbeat from core client for 30 sec - exiting 15:51:25 (2200): No heartbeat from core client for 30 sec - exiting 15:51:26 (2200): No heartbeat from core client for 30 sec - exiting 15:51:27 (2200): No heartbeat from core client for 30 sec - exiting 15:51:28 (2200): No heartbeat from core client for 30 sec - exiting 15:51:29 (2200): No heartbeat from core client for 30 sec - exiting 15:51:30 (2200): No heartbeat from core client for 30 sec - exiting 15:51:31 (2200): No heartbeat from core client for 30 sec - exiting 15:51:32 (2200): No heartbeat from core client for 30 sec - exiting 15:51:33 (2200): No heartbeat from core client for 30 sec - exiting 15:51:34 (2200): No heartbeat from core client for 30 sec - exiting 15:51:35 (2200): No heartbeat from core client for 30 sec - exiting 15:51:37 (2200): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... cpdnmonitor: cannot open input file C:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o3bl_2140_40_008269551/dataout/atmos_restart.day after 11 attempts cpdnmonitor: cannot open input file C:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o3bl_2140_40_008269551/dataout/ocean_restart.day after 11 attempts Model crashed: READ_FLH: I/O error tmp/pipe_dummy 2048 cpdnmonitor: cannot open input file C:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o3bl_2140_40_008269551/dataout/atmos_restart.day after 11 attempts cpdnmonitor: cannot open input file C:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o3bl_2140_40_008269551/dataout/ocean_restart.day after 11 attempts Model crashed: READ_FLH: I/O error tmp/pipe_dummy 2048 cpdnmonitor: cannot open input file C:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o3bl_2140_40_008269551/dataout/atmos_restart.day after 11 attempts cpdnmonitor: cannot open input file C:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o3bl_2140_40_008269551/dataout/ocean_restart.day after 11 attempts Model crashed: READ_FLH: I/O error tmp/pipe_dummy 2048 cpdnmonitor: cannot open input file C:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o3bl_2140_40_008269551/dataout/atmos_restart.day after 11 attempts cpdnmonitor: cannot open input file C:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o3bl_2140_40_008269551/dataout/ocean_restart.day after 11 attempts Model crashed: READ_FLH: I/O error tmp/pipe_dummy 2048 cpdnmonitor: cannot open input file C:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o3bl_2140_40_008269551/dataout/atmos_restart.day after 11 attempts cpdnmonitor: cannot open input file C:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o3bl_2140_40_008269551/dataout/ocean_restart.day after 11 attempts Model crashed: READ_FLH: I/O error tmp/pipe_dummy 2048 cpdnmonitor: cannot open input file C:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o3bl_2140_40_008269551/dataout/atmos_restart.day after 11 attempts cpdnmonitor: cannot open input file C:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_o3bl_2140_40_008269551/dataout/ocean_restart.day after 11 attempts Model crashed: READ_FLH: I/O error tmp/pipe_dummy 2048 Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
13 Feb 2013 19:55:38	1134660	15582383	hadcm3n_o3bl_2140_40_008269551_2	518,400	738,557	1.4247
13 Feb 2013 08:16:15	1134660	15582383	hadcm3n_o3bl_2140_40_008269551_2	492,480	700,880	1.4232
12 Feb 2013 22:59:12	1134660	15582383	hadcm3n_o3bl_2140_40_008269551_2	466,560	663,803	1.4228
12 Feb 2013 12:15:48	1134660	15582383	hadcm3n_o3bl_2140_40_008269551_2	440,640	627,509	1.4241
12 Feb 2013 01:48:00	1134660	15582383	hadcm3n_o3bl_2140_40_008269551_2	414,720	590,930	1.4249
11 Feb 2013 15:30:46	1134660	15582383	hadcm3n_o3bl_2140_40_008269551_2	388,800	554,580	1.4264
11 Feb 2013 05:20:27	1134660	15582383	hadcm3n_o3bl_2140_40_008269551_2	362,880	518,249	1.4282
10 Feb 2013 19:19:40	1134660	15582383	hadcm3n_o3bl_2140_40_008269551_2	336,960	481,814	1.4299
10 Feb 2013 09:57:26	1134660	15582383	hadcm3n_o3bl_2140_40_008269551_2	311,040	445,407	1.4320
09 Feb 2013 22:34:21	1134660	15582383	hadcm3n_o3bl_2140_40_008269551_2	285,120	407,538	1.4294
09 Feb 2013 12:27:43	1134660	15582383	hadcm3n_o3bl_2140_40_008269551_2	259,200	369,655	1.4261
09 Feb 2013 01:24:59	1134660	15582383	hadcm3n_o3bl_2140_40_008269551_2	233,280	331,685	1.4218
08 Feb 2013 14:55:38	1134660	15582383	hadcm3n_o3bl_2140_40_008269551_2	207,360	294,006	1.4179
08 Feb 2013 04:30:26	1134660	15582383	hadcm3n_o3bl_2140_40_008269551_2	181,440	256,356	1.4129
07 Feb 2013 18:24:08	1134660	15582383	hadcm3n_o3bl_2140_40_008269551_2	155,520	219,044	1.4085
07 Feb 2013 06:12:03	1134660	15582383	hadcm3n_o3bl_2140_40_008269551_2	129,600	182,501	1.4082
06 Feb 2013 20:31:57	1134660	15582383	hadcm3n_o3bl_2140_40_008269551_2	103,680	145,736	1.4056
05 Feb 2013 07:51:42	1134660	15582383	hadcm3n_o3bl_2140_40_008269551_2	77,760	107,807	1.3864
04 Feb 2013 21:03:22	1134660	15582383	hadcm3n_o3bl_2140_40_008269551_2	51,840	66,395	1.2808
04 Feb 2013 10:13:06	1134660	15582383	hadcm3n_o3bl_2140_40_008269551_2	25,920	34,017	1.3124