Task 15484879

Name	hadcm3n_39e3_1940_40_008257480_0
Workunit	8412604
Created	20 Dec 2012, 7:27:38 UTC
Sent	20 Dec 2012, 7:27:50 UTC
Report deadline	21 Mar 2013, 14:55:01 UTC
Received	25 Jan 2014, 17:44:20 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1158390
Run time	9 days 16 hours 9 min 52 sec
CPU time	8 days 2 hours 38 min 19 sec
Validate state	Invalid
Credit	5,598.72
Device peak FLOPS	2.47 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.2.33</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 15:43:22 (5240): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 08:38:51 (6680): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 08:45:52 (2268): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4864, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4864, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4864, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 23:06:24 (5488): No heartbeat from core client for 30 sec - exiting 23:06:26 (5488): No heartbeat from core client for 30 sec - exiting 23:06:27 (5488): No heartbeat from core client for 30 sec - exiting 23:06:28 (5488): No heartbeat from core client for 30 sec - exiting 23:06:29 (5488): No heartbeat from core client for 30 sec - exiting 23:06:30 (5488): No heartbeat from core client for 30 sec - exiting 23:06:31 (5488): No heartbeat from core client for 30 sec - exiting 23:06:32 (5488): No heartbeat from core client for 30 sec - exiting 23:06:33 (5488): No heartbeat from core client for 30 sec - exiting 23:06:34 (5488): No heartbeat from core client for 30 sec - exiting 23:06:35 (5488): No heartbeat from core client for 30 sec - exiting 23:06:36 (5488): No heartbeat from core client for 30 sec - exiting 23:06:37 (5488): No heartbeat from core client for 30 sec - exiting 23:06:38 (5488): No heartbeat from core client for 30 sec - exiting 23:06:39 (5488): No heartbeat from core client for 30 sec - exiting 23:06:40 (5488): No heartbeat from core client for 30 sec - exiting 23:06:41 (5488): No heartbeat from core client for 30 sec - exiting 23:06:42 (5488): No heartbeat from core client for 30 sec - exiting 23:06:43 (5488): No heartbeat from core client for 30 sec - exiting 23:06:44 (5488): No heartbeat from core client for 30 sec - exiting 23:06:45 (5488): No heartbeat from core client for 30 sec - exiting 23:06:46 (5488): No heartbeat from core client for 30 sec - exiting 23:06:47 (5488): No heartbeat from core client for 30 sec - exiting 23:06:48 (5488): No heartbeat from core client for 30 sec - exiting 23:06:49 (5488): No heartbeat from core client for 30 sec - exiting 23:06:50 (5488): No heartbeat from core client for 30 sec - exiting 23:06:51 (5488): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 20:19:00 (4108): No heartbeat from core client for 30 sec - exiting 20:19:01 (4108): No heartbeat from core client for 30 sec - exiting 20:19:02 (4108): No heartbeat from core client for 30 sec - exiting 20:19:04 (4108): No heartbeat from core client for 30 sec - exiting 20:19:05 (4108): No heartbeat from core client for 30 sec - exiting 20:19:06 (4108): No heartbeat from core client for 30 sec - exiting 20:19:07 (4108): No heartbeat from core client for 30 sec - exiting 20:19:08 (4108): No heartbeat from core client for 30 sec - exiting 20:19:09 (4108): No heartbeat from core client for 30 sec - exiting 20:19:10 (4108): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 03:07:48 (4908): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 08:52:34 (6348): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 12:49:24 (5916): No heartbeat from core client for 30 sec - exiting 12:49:26 (5916): No heartbeat from core client for 30 sec - exiting 12:49:27 (5916): No heartbeat from core client for 30 sec - exiting 12:49:28 (5916): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4532, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4532, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4532, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4532, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4532, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4532, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
21 Jan 2014 13:10:48	1158390	15484879	hadcm3n_39e3_1940_40_008257480_0	466,560	686,017	1.4704
20 Jan 2014 11:15:50	1158390	15484879	hadcm3n_39e3_1940_40_008257480_0	440,640	647,775	1.4701
19 Jan 2014 20:47:40	1158390	15484879	hadcm3n_39e3_1940_40_008257480_0	414,720	609,947	1.4707
18 Jan 2014 12:33:13	1158390	15484879	hadcm3n_39e3_1940_40_008257480_0	388,800	572,184	1.4717
23 Nov 2013 09:32:14	1158390	15484879	hadcm3n_39e3_1940_40_008257480_0	362,880	534,094	1.4718
22 Nov 2013 21:03:59	1158390	15484879	hadcm3n_39e3_1940_40_008257480_0	336,960	494,612	1.4679
22 Nov 2013 08:31:06	1158390	15484879	hadcm3n_39e3_1940_40_008257480_0	311,040	455,128	1.4632
13 Apr 2013 18:49:18	1158390	15484879	hadcm3n_39e3_1940_40_008257480_0	285,120	416,418	1.4605
13 Apr 2013 04:32:03	1158390	15484879	hadcm3n_39e3_1940_40_008257480_0	259,200	377,783	1.4575
12 Apr 2013 01:06:39	1158390	15484879	hadcm3n_39e3_1940_40_008257480_0	233,280	338,648	1.4517
06 Apr 2013 23:09:34	1158390	15484879	hadcm3n_39e3_1940_40_008257480_0	207,360	300,214	1.4478
06 Apr 2013 11:19:35	1158390	15484879	hadcm3n_39e3_1940_40_008257480_0	181,440	262,279	1.4455
05 Apr 2013 06:03:31	1158390	15484879	hadcm3n_39e3_1940_40_008257480_0	155,520	224,106	1.4410
23 Mar 2013 16:45:57	1158390	15484879	hadcm3n_39e3_1940_40_008257480_0	129,600	185,456	1.4310
02 Mar 2013 07:02:33	1158390	15484879	hadcm3n_39e3_1940_40_008257480_0	103,680	146,620	1.4142
03 Feb 2013 02:31:15	1158390	15484879	hadcm3n_39e3_1940_40_008257480_0	77,760	108,221	1.3917
21 Dec 2012 18:38:49	1158390	15484879	hadcm3n_39e3_1940_40_008257480_0	51,840	77,997	1.5046
20 Dec 2012 19:36:55	1158390	15484879	hadcm3n_39e3_1940_40_008257480_0	25,920	38,721	1.4939