Task 16677674

Name	hadcm3n_8epy_1980_40_008728497_1
Workunit	8874475
Created	20 Jun 2014, 18:02:49 UTC
Sent	20 Jun 2014, 18:02:54 UTC
Report deadline	20 Sep 2014, 1:30:05 UTC
Received	30 Jun 2014, 4:37:17 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1300249
Run time	4 days 5 hours 40 min 2 sec
CPU time	4 days 5 hours 1 min 35 sec
Validate state	Invalid
Credit	5,287.68
Device peak FLOPS	2.99 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.2.28</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 14:32:00 (5500): No heartbeat from core client for 30 sec - exiting 14:32:01 (5500): No heartbeat from core client for 30 sec - exiting 14:32:02 (5500): No heartbeat from core client for 30 sec - exiting 14:32:03 (5500): No heartbeat from core client for 30 sec - exiting 14:32:04 (5500): No heartbeat from core client for 30 sec - exiting 14:32:05 (5500): No heartbeat from core client for 30 sec - exiting 14:32:06 (5500): No heartbeat from core client for 30 sec - exiting 14:32:07 (5500): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=972, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=972, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=972, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=972, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=972, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=972, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
26 Jun 2014 17:57:31	1300249	16677674	hadcm3n_8epy_1980_40_008728497_1	440,640	345,375	0.7838
26 Jun 2014 10:09:38	1300249	16677674	hadcm3n_8epy_1980_40_008728497_1	414,720	325,139	0.7840
26 Jun 2014 04:27:17	1300249	16677674	hadcm3n_8epy_1980_40_008728497_1	388,800	304,738	0.7838
25 Jun 2014 21:50:51	1300249	16677674	hadcm3n_8epy_1980_40_008728497_1	362,880	284,254	0.7833
25 Jun 2014 16:06:23	1300249	16677674	hadcm3n_8epy_1980_40_008728497_1	336,960	264,005	0.7835
25 Jun 2014 02:01:31	1300249	16677674	hadcm3n_8epy_1980_40_008728497_1	311,040	243,640	0.7833
24 Jun 2014 19:49:18	1300249	16677674	hadcm3n_8epy_1980_40_008728497_1	285,120	223,106	0.7825
24 Jun 2014 11:37:50	1300249	16677674	hadcm3n_8epy_1980_40_008728497_1	259,200	202,802	0.7824
24 Jun 2014 05:56:57	1300249	16677674	hadcm3n_8epy_1980_40_008728497_1	233,280	182,444	0.7821
24 Jun 2014 00:21:02	1300249	16677674	hadcm3n_8epy_1980_40_008728497_1	207,360	162,263	0.7825
23 Jun 2014 17:59:49	1300249	16677674	hadcm3n_8epy_1980_40_008728497_1	181,440	141,988	0.7826
23 Jun 2014 12:25:17	1300249	16677674	hadcm3n_8epy_1980_40_008728497_1	155,520	121,533	0.7815
23 Jun 2014 12:25:17	1300249	16677674	hadcm3n_8epy_1980_40_008728497_1	129,600	101,327	0.7818
23 Jun 2014 12:25:17	1300249	16677674	hadcm3n_8epy_1980_40_008728497_1	103,680	81,087	0.7821
23 Jun 2014 12:25:17	1300249	16677674	hadcm3n_8epy_1980_40_008728497_1	77,760	60,764	0.7814
23 Jun 2014 12:25:17	1300249	16677674	hadcm3n_8epy_1980_40_008728497_1	51,840	40,452	0.7803
21 Jun 2014 00:49:17	1300249	16677674	hadcm3n_8epy_1980_40_008728497_1	25,920	20,197	0.7792