Task 13023363

Name	hadcm3n_t3l4_1940_40_007315228_0
Workunit	7512658
Created	28 Jun 2011, 20:20:18 UTC
Sent	28 Jun 2011, 20:34:32 UTC
Report deadline	28 Sep 2011, 4:01:43 UTC
Received	13 Oct 2011, 22:13:30 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1150749
Run time	8 days 3 hours 29 min 16 sec
CPU time	7 days 21 hours 16 min 7 sec
Validate state	Invalid
Credit	6,220.80
Device peak FLOPS	2.82 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.12.33</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1040, iMonCtr=1 Model crash detected, will try to restart... 19:45:16 (3704): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 21:05:24 (860): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 15:34:47 (4796): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 18:33:36 (2080): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 21:32:19 (1104): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 16:27:10 (3580): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 19:25:58 (4004): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 22:24:34 (6384): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 01:23:15 (5300): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 04:21:54 (5300): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 07:20:27 (4256): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 10:19:22 (5432): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 11:07:04 (3736): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 13:18:19 (4128): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 16:17:16 (7076): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 13:20:55 (3788): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 15:19:49 (5100): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 17:18:46 (3904): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 19:17:39 (1972): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 21:16:33 (4932): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 17:12:11 (984): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 21:11:05 (5992): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 02:09:51 (5512): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 06:08:32 (5916): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 10:07:13 (384): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 13:06:06 (2420): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 16:13:58 (5100): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 18:00:18 (4844): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 19:15:18 (2400): Can't acquire lockfile (32) - waiting 35s 19:15:22 (1036): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 19:15:53 (2580): Can't acquire lockfile (32) - waiting 35s 19:15:53 (2400): Can't acquire lockfile (32) - exiting 19:15:53 (2400): Error: The process cannot access the file because it is being used by another process. (0x20) 19:16:12 (4528): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 18:40:27 (2224): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 21:39:12 (4184): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 13:11:09 (2540): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... zip error: Could not create output file (was replacing the original zip file) cpdnmonitor: cannot open input file W:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_t3l4_1940_40_007315228/dataout/atmos_restart.day after 11 attempts cpdnmonitor: cannot open input file W:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_t3l4_1940_40_007315228/dataout/ocean_restart.day after 11 attempts Model crashed: READ_FLH: I/O error tmp/pipe_dummy 2048 cpdnmonitor: cannot open input file W:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_t3l4_1940_40_007315228/dataout/atmos_restart.day after 11 attempts cpdnmonitor: cannot open input file W:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_t3l4_1940_40_007315228/dataout/ocean_restart.day after 11 attempts Model crashed: READ_FLH: I/O error tmp/pipe_dummy 2048 cpdnmonitor: cannot open input file W:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_t3l4_1940_40_007315228/dataout/atmos_restart.day after 11 attempts cpdnmonitor: cannot open input file W:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_t3l4_1940_40_007315228/dataout/ocean_restart.day after 11 attempts Model crashed: READ_FLH: I/O error tmp/pipe_dummy 2048 cpdnmonitor: cannot open input file W:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_t3l4_1940_40_007315228/dataout/atmos_restart.day after 11 attempts cpdnmonitor: cannot open input file W:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_t3l4_1940_40_007315228/dataout/ocean_restart.day after 11 attempts Model crashed: READ_FLH: I/O error tmp/pipe_dummy 2048 cpdnmonitor: cannot open input file W:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_t3l4_1940_40_007315228/dataout/atmos_restart.day after 11 attempts cpdnmonitor: cannot open input file W:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_t3l4_1940_40_007315228/dataout/ocean_restart.day after 11 attempts Model crashed: READ_FLH: I/O error tmp/pipe_dummy 2048 cpdnmonitor: cannot open input file W:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_t3l4_1940_40_007315228/dataout/atmos_restart.day after 11 attempts cpdnmonitor: cannot open input file W:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_t3l4_1940_40_007315228/dataout/ocean_restart.day after 11 attempts Model crashed: READ_FLH: I/O error tmp/pipe_dummy 2048 Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
13 Oct 2011 21:13:53	1150749	13023363	hadcm3n_t3l4_1940_40_007315228_0	518,400	681,427	1.3145
10 Oct 2011 04:09:12	1150749	13023363	hadcm3n_t3l4_1940_40_007315228_0	492,480	647,205	1.3142
09 Oct 2011 18:49:44	1150749	13023363	hadcm3n_t3l4_1940_40_007315228_0	466,560	613,007	1.3139
08 Oct 2011 01:50:46	1150749	13023363	hadcm3n_t3l4_1940_40_007315228_0	440,640	578,721	1.3134
02 Oct 2011 21:47:16	1150749	13023363	hadcm3n_t3l4_1940_40_007315228_0	414,720	546,506	1.3178
27 Sep 2011 13:26:10	1150749	13023363	hadcm3n_t3l4_1940_40_007315228_0	388,800	514,118	1.3223
27 Sep 2011 03:39:46	1150749	13023363	hadcm3n_t3l4_1940_40_007315228_0	362,880	479,911	1.3225
25 Sep 2011 01:56:05	1150749	13023363	hadcm3n_t3l4_1940_40_007315228_0	336,960	445,324	1.3216
24 Sep 2011 11:12:57	1150749	13023363	hadcm3n_t3l4_1940_40_007315228_0	311,040	411,327	1.3224
23 Sep 2011 22:39:49	1150749	13023363	hadcm3n_t3l4_1940_40_007315228_0	285,120	377,331	1.3234
12 Sep 2011 04:20:22	1150749	13023363	hadcm3n_t3l4_1940_40_007315228_0	259,200	343,171	1.3240
11 Sep 2011 18:59:33	1150749	13023363	hadcm3n_t3l4_1940_40_007315228_0	233,280	308,920	1.3242
10 Sep 2011 19:20:54	1150749	13023363	hadcm3n_t3l4_1940_40_007315228_0	207,360	274,176	1.3222
10 Sep 2011 08:30:29	1150749	13023363	hadcm3n_t3l4_1940_40_007315228_0	181,440	239,586	1.3205
09 Sep 2011 22:09:19	1150749	13023363	hadcm3n_t3l4_1940_40_007315228_0	155,520	205,347	1.3204
29 Aug 2011 01:26:30	1150749	13023363	hadcm3n_t3l4_1940_40_007315228_0	129,600	171,133	1.3205
22 Aug 2011 03:27:19	1150749	13023363	hadcm3n_t3l4_1940_40_007315228_0	103,680	136,833	1.3198
03 Jul 2011 01:01:43	1150749	13023363	hadcm3n_t3l4_1940_40_007315228_0	77,760	102,782	1.3218
30 Jun 2011 04:02:47	1150749	13023363	hadcm3n_t3l4_1940_40_007315228_0	51,840	68,856	1.3282
29 Jun 2011 07:22:44	1150749	13023363	hadcm3n_t3l4_1940_40_007315228_0	25,920	34,604	1.3350