Task 12921739

Name	hadcm3n_o29h_1940_40_007265210_1
Workunit	7463450
Created	2 Jun 2011, 5:51:39 UTC
Sent	2 Jun 2011, 5:51:40 UTC
Report deadline	1 Sep 2011, 13:18:51 UTC
Received	21 Jun 2011, 13:39:37 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1127888
Run time	8 days 17 hours 15 min 16 sec
CPU time	7 days 23 hours 39 min 51 sec
Validate state	Invalid
Credit	4,354.56
Device peak FLOPS	2.31 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.12.26</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 03:32:34 (4484): No heartbeat from core client for 30 sec - exiting 03:32:35 (4484): No heartbeat from core client for 30 sec - exiting 03:32:37 (4484): No heartbeat from core client for 30 sec - exiting 03:32:38 (4484): No heartbeat from core client for 30 sec - exiting 03:32:39 (4484): No heartbeat from core client for 30 sec - exiting 03:32:40 (4484): No heartbeat from core client for 30 sec - exiting 03:32:41 (4484): No heartbeat from core client for 30 sec - exiting 03:32:42 (4484): No heartbeat from core client for 30 sec - exiting 03:32:43 (4484): No heartbeat from core client for 30 sec - exiting 03:32:44 (4484): No heartbeat from core client for 30 sec - exiting 03:32:45 (4484): No heartbeat from core client for 30 sec - exiting 03:32:46 (4484): No heartbeat from core client for 30 sec - exiting 03:32:47 (4484): No heartbeat from core client for 30 sec - exiting 03:32:49 (4484): No heartbeat from core client for 30 sec - exiting 03:32:50 (4484): No heartbeat from core client for 30 sec - exiting 03:32:51 (4484): No heartbeat from core client for 30 sec - exiting 03:32:52 (4484): No heartbeat from core client for 30 sec - exiting 03:32:54 (4484): No heartbeat from core client for 30 sec - exiting 03:32:55 (4484): No heartbeat from core client for 30 sec - exiting 03:32:56 (4484): No heartbeat from core client for 30 sec - exiting 03:32:57 (4484): No heartbeat from core client for 30 sec - exiting 03:32:59 (4484): No heartbeat from core client for 30 sec - exiting 03:33:00 (4484): No heartbeat from core client for 30 sec - exiting 03:33:01 (4484): No heartbeat from core client for 30 sec - exiting 03:33:02 (4484): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 03:33:03 (4484): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... 19:11:27 (5972): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 03:44:55 (8744): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 08:58:57 (9500): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... forrtl: The requested operation cannot be performed on a file with a user-mapped section open. Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7508, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5400, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5400, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5400, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5400, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5400, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5400, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
20 Jun 2011 05:53:57	1127888	12921739	hadcm3n_o29h_1940_40_007265210_1	362,880	656,787	1.8099
19 Jun 2011 22:44:03	1127888	12921739	hadcm3n_o29h_1940_40_007265210_1	336,960	609,915	1.8101
19 Jun 2011 22:44:03	1127888	12921739	hadcm3n_o29h_1940_40_007265210_1	311,040	559,077	1.7974
19 Jun 2011 22:00:01	1127888	12921739	hadcm3n_o29h_1940_40_007265210_1	285,120	512,003	1.7957
17 Jun 2011 07:20:02	1127888	12921739	hadcm3n_o29h_1940_40_007265210_1	259,200	465,813	1.7971
16 Jun 2011 12:11:37	1127888	12921739	hadcm3n_o29h_1940_40_007265210_1	233,280	420,324	1.8018
15 Jun 2011 17:42:32	1127888	12921739	hadcm3n_o29h_1940_40_007265210_1	207,360	371,872	1.7934
15 Jun 2011 01:16:26	1127888	12921739	hadcm3n_o29h_1940_40_007265210_1	181,440	323,735	1.7843
14 Jun 2011 10:37:06	1127888	12921739	hadcm3n_o29h_1940_40_007265210_1	155,520	278,519	1.7909
13 Jun 2011 19:31:16	1127888	12921739	hadcm3n_o29h_1940_40_007265210_1	129,600	233,180	1.7992
12 Jun 2011 12:04:23	1127888	12921739	hadcm3n_o29h_1940_40_007265210_1	103,680	185,478	1.7889
11 Jun 2011 12:36:42	1127888	12921739	hadcm3n_o29h_1940_40_007265210_1	77,760	139,027	1.7879
09 Jun 2011 13:17:03	1127888	12921739	hadcm3n_o29h_1940_40_007265210_1	51,840	91,853	1.7719
08 Jun 2011 18:57:30	1127888	12921739	hadcm3n_o29h_1940_40_007265210_1	25,920	45,595	1.7591