Task 16697911

Name	hadcm3n_89ui_1980_40_008722181_3
Workunit	8868159
Created	3 Jul 2014, 6:11:21 UTC
Sent	3 Jul 2014, 6:11:36 UTC
Report deadline	2 Oct 2014, 13:38:47 UTC
Received	17 Dec 2014, 6:36:56 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1151140
Run time	9 days 21 hours 39 min 40 sec
CPU time	9 days 17 hours 14 min 58 sec
Validate state	Invalid
Credit	5,598.72
Device peak FLOPS	2.19 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.2.42</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 10:17:47 (3436): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 04:13:01 (3624): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 01:12:04 (30564): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 06:11:08 (54464): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5008, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5008, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5008, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5008, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5008, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5008, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish 17:11:55 (5008): No heartbeat from core client for 30 sec - exiting 17:11:56 (5008): No heartbeat from core client for 30 sec - exiting </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
17 Dec 2014 02:59:56	1151140	16697911	hadcm3n_89ui_1980_40_008722181_3	466,560	814,535	1.7458
17 Dec 2014 02:59:56	1151140	16697911	hadcm3n_89ui_1980_40_008722181_3	440,640	770,178	1.7479
17 Dec 2014 02:59:56	1151140	16697911	hadcm3n_89ui_1980_40_008722181_3	414,720	725,797	1.7501
17 Dec 2014 02:59:56	1151140	16697911	hadcm3n_89ui_1980_40_008722181_3	388,800	681,326	1.7524
17 Dec 2014 02:59:56	1151140	16697911	hadcm3n_89ui_1980_40_008722181_3	362,880	636,926	1.7552
17 Dec 2014 02:59:56	1151140	16697911	hadcm3n_89ui_1980_40_008722181_3	336,960	592,471	1.7583
17 Dec 2014 02:59:56	1151140	16697911	hadcm3n_89ui_1980_40_008722181_3	311,040	548,052	1.7620
17 Dec 2014 02:59:56	1151140	16697911	hadcm3n_89ui_1980_40_008722181_3	285,120	503,738	1.7668
17 Dec 2014 02:59:56	1151140	16697911	hadcm3n_89ui_1980_40_008722181_3	259,200	459,345	1.7722
17 Dec 2014 02:59:56	1151140	16697911	hadcm3n_89ui_1980_40_008722181_3	233,280	414,967	1.7788
09 Jul 2014 09:28:08	1151140	16697911	hadcm3n_89ui_1980_40_008722181_3	207,360	368,975	1.7794
08 Jul 2014 18:19:47	1151140	16697911	hadcm3n_89ui_1980_40_008722181_3	181,440	322,967	1.7800
08 Jul 2014 03:30:24	1151140	16697911	hadcm3n_89ui_1980_40_008722181_3	155,520	276,647	1.7789
07 Jul 2014 11:44:06	1151140	16697911	hadcm3n_89ui_1980_40_008722181_3	129,600	230,596	1.7793
06 Jul 2014 21:57:32	1151140	16697911	hadcm3n_89ui_1980_40_008722181_3	103,680	184,800	1.7824
06 Jul 2014 01:55:49	1151140	16697911	hadcm3n_89ui_1980_40_008722181_3	77,760	138,949	1.7869
04 Jul 2014 20:52:06	1151140	16697911	hadcm3n_89ui_1980_40_008722181_3	51,840	92,865	1.7914
04 Jul 2014 02:59:25	1151140	16697911	hadcm3n_89ui_1980_40_008722181_3	25,920	47,127	1.8182