Task 16289757

Name	hadcm3n_7hf6_1980_40_008433861_3
Workunit	8584717
Created	11 Feb 2014, 0:44:21 UTC
Sent	11 Feb 2014, 0:44:30 UTC
Report deadline	15 Aug 2023, 6:04:30 UTC
Received	17 Feb 2014, 15:16:54 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1305960
Run time	4 days 8 hours 10 min 36 sec
CPU time	4 days 4 hours 44 min 11 sec
Validate state	Invalid
Credit	7,464.96
Device peak FLOPS	4.06 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.2.33</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 21:51:03 (7128): No heartbeat from core client for 30 sec - exiting 21:51:04 (7128): No heartbeat from core client for 30 sec - exiting 21:51:05 (7128): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5844, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6036, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6036, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6036, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5748, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5748, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
18 Feb 2014 12:02:13	1305960	16289757	hadcm3n_7hf6_1980_40_008433861_3	622,080	358,654	0.5765
18 Feb 2014 12:02:13	1305960	16289757	hadcm3n_7hf6_1980_40_008433861_3	596,160	343,191	0.5757
16 Feb 2014 17:06:49	1305960	16289757	hadcm3n_7hf6_1980_40_008433861_3	570,240	328,344	0.5758
16 Feb 2014 07:48:30	1305960	16289757	hadcm3n_7hf6_1980_40_008433861_3	544,320	313,134	0.5753
16 Feb 2014 02:52:48	1305960	16289757	hadcm3n_7hf6_1980_40_008433861_3	518,400	297,632	0.5741
15 Feb 2014 20:36:45	1305960	16289757	hadcm3n_7hf6_1980_40_008433861_3	492,480	282,361	0.5733
15 Feb 2014 16:19:33	1305960	16289757	hadcm3n_7hf6_1980_40_008433861_3	466,560	267,197	0.5727
15 Feb 2014 05:41:20	1305960	16289757	hadcm3n_7hf6_1980_40_008433861_3	440,640	252,028	0.5720
15 Feb 2014 01:25:43	1305960	16289757	hadcm3n_7hf6_1980_40_008433861_3	414,720	237,098	0.5717
14 Feb 2014 21:24:57	1305960	16289757	hadcm3n_7hf6_1980_40_008433861_3	388,800	221,918	0.5708
14 Feb 2014 16:48:04	1305960	16289757	hadcm3n_7hf6_1980_40_008433861_3	362,880	207,015	0.5705
14 Feb 2014 04:15:12	1305960	16289757	hadcm3n_7hf6_1980_40_008433861_3	336,960	192,006	0.5698
13 Feb 2014 23:54:21	1305960	16289757	hadcm3n_7hf6_1980_40_008433861_3	311,040	177,069	0.5693
13 Feb 2014 19:33:31	1305960	16289757	hadcm3n_7hf6_1980_40_008433861_3	285,120	162,095	0.5685
13 Feb 2014 16:21:39	1305960	16289757	hadcm3n_7hf6_1980_40_008433861_3	259,200	147,167	0.5678
13 Feb 2014 03:16:37	1305960	16289757	hadcm3n_7hf6_1980_40_008433861_3	233,280	132,730	0.5690
12 Feb 2014 23:36:02	1305960	16289757	hadcm3n_7hf6_1980_40_008433861_3	207,360	118,362	0.5708
12 Feb 2014 19:15:11	1305960	16289757	hadcm3n_7hf6_1980_40_008433861_3	181,440	103,911	0.5727
12 Feb 2014 08:11:26	1305960	16289757	hadcm3n_7hf6_1980_40_008433861_3	155,520	89,219	0.5737
12 Feb 2014 04:55:55	1305960	16289757	hadcm3n_7hf6_1980_40_008433861_3	129,600	74,362	0.5738