Task 13611752

Name	hadcm3n_u0s9_1980_40_007540401_0
Workunit	7737633
Created	6 Nov 2011, 6:46:45 UTC
Sent	6 Nov 2011, 8:23:11 UTC
Report deadline	5 Feb 2012, 15:50:22 UTC
Received	22 Dec 2011, 12:53:36 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1151707
Run time	12 days 20 hours 29 min 13 sec
CPU time	11 days 14 hours 30 min 53 sec
Validate state	Invalid
Credit	6,842.88
Device peak FLOPS	2.50 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.12.34</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4196, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2016, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... 19:49:21 (1888): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5524, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3100, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3216, iMonCtr=1 Model crash detected, will try to restart... 08:20:36 (2632): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 16:45:10 (500): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 18:56:58 (3704): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 16:39:58 (3636): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 17:24:08 (3768): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3480, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3564, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4560, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4688, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2672, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2660, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... cpdnmonitor: cannot open input file C:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_u0s9_1980_40_007540401/dataout/ocean_restart.day after 11 attempts Model crashed: INITDUMP: Wrong no of atmos prognostic fields tmp/pipe_dummy 2048 cpdnmonitor: cannot open input file C:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_u0s9_1980_40_007540401/dataout/ocean_restart.day after 11 attempts Model crashed: INITDUMP: Wrong no of atmos prognostic fields tmp/pipe_dummy 2048 cpdnmonitor: cannot open input file C:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_u0s9_1980_40_007540401/dataout/ocean_restart.day after 11 attempts Model crashed: INITDUMP: Wrong no of atmos prognostic fields tmp/pipe_dummy 2048 cpdnmonitor: cannot open input file C:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_u0s9_1980_40_007540401/dataout/ocean_restart.day after 11 attempts Model crashed: INITDUMP: Wrong no of atmos prognostic fields tmp/pipe_dummy 2048 cpdnmonitor: cannot open input file C:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_u0s9_1980_40_007540401/dataout/ocean_restart.day after 11 attempts Model crashed: INITDUMP: Wrong no of atmos prognostic fields tmp/pipe_dummy 2048 cpdnmonitor: cannot open input file C:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_u0s9_1980_40_007540401/dataout/ocean_restart.day after 11 attempts Model crashed: INITDUMP: Wrong no of atmos prognostic fields tmp/pipe_dummy 2048 Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
18 Dec 2011 08:07:23	1151707	13611752	hadcm3n_u0s9_1980_40_007540401_0	570,240	994,217	1.7435
17 Dec 2011 19:07:24	1151707	13611752	hadcm3n_u0s9_1980_40_007540401_0	544,320	949,365	1.7441
16 Dec 2011 11:02:03	1151707	13611752	hadcm3n_u0s9_1980_40_007540401_0	518,400	902,779	1.7415
14 Dec 2011 10:43:19	1151707	13611752	hadcm3n_u0s9_1980_40_007540401_0	492,480	854,575	1.7352
13 Dec 2011 22:55:05	1151707	13611752	hadcm3n_u0s9_1980_40_007540401_0	466,560	805,917	1.7274
12 Dec 2011 13:49:58	1151707	13611752	hadcm3n_u0s9_1980_40_007540401_0	440,640	759,056	1.7226
07 Dec 2011 04:39:34	1151707	13611752	hadcm3n_u0s9_1980_40_007540401_0	414,720	714,356	1.7225
05 Dec 2011 06:35:26	1151707	13611752	hadcm3n_u0s9_1980_40_007540401_0	388,800	670,679	1.7250
03 Dec 2011 08:26:11	1151707	13611752	hadcm3n_u0s9_1980_40_007540401_0	362,880	626,743	1.7271
02 Dec 2011 22:23:29	1151707	13611752	hadcm3n_u0s9_1980_40_007540401_0	336,960	582,955	1.7300
01 Dec 2011 13:27:37	1151707	13611752	hadcm3n_u0s9_1980_40_007540401_0	311,040	538,822	1.7323
27 Nov 2011 08:20:36	1151707	13611752	hadcm3n_u0s9_1980_40_007540401_0	285,120	493,958	1.7325
26 Nov 2011 03:23:12	1151707	13611752	hadcm3n_u0s9_1980_40_007540401_0	259,200	449,369	1.7337
25 Nov 2011 13:47:14	1151707	13611752	hadcm3n_u0s9_1980_40_007540401_0	233,280	403,804	1.7310
22 Nov 2011 11:09:21	1151707	13611752	hadcm3n_u0s9_1980_40_007540401_0	207,360	358,691	1.7298
20 Nov 2011 11:53:31	1151707	13611752	hadcm3n_u0s9_1980_40_007540401_0	181,440	313,507	1.7279
19 Nov 2011 02:37:06	1151707	13611752	hadcm3n_u0s9_1980_40_007540401_0	155,520	267,740	1.7216
18 Nov 2011 13:25:25	1151707	13611752	hadcm3n_u0s9_1980_40_007540401_0	129,600	223,235	1.7225
16 Nov 2011 13:41:07	1151707	13611752	hadcm3n_u0s9_1980_40_007540401_0	103,680	178,793	1.7245
16 Nov 2011 07:49:29	1151707	13611752	hadcm3n_u0s9_1980_40_007540401_0	77,760	134,321	1.7274