Task 15626429

Name	hadcm3n_zghi_1880_40_008246824_3
Workunit	8401948
Created	23 Feb 2013, 1:04:55 UTC
Sent	23 Feb 2013, 1:05:05 UTC
Report deadline	25 May 2013, 8:32:16 UTC
Received	29 Oct 2014, 12:37:19 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1110232
Run time	20 days 7 hours 24 min 1 sec
CPU time	8 days 16 hours 39 min 52 sec
Validate state	Invalid
Credit	5,287.68
Device peak FLOPS	2.36 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.12.33</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 11:20:17 (1412): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2360, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2360, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2360, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2360, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2360, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2360, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
08 Apr 2014 15:18:30	1110232	15626429	hadcm3n_zghi_1880_40_008246824_3	440,640	745,552	1.6920
08 Apr 2014 02:34:44	1110232	15626429	hadcm3n_zghi_1880_40_008246824_3	414,720	700,731	1.6896
07 Apr 2014 13:53:05	1110232	15626429	hadcm3n_zghi_1880_40_008246824_3	388,800	655,860	1.6869
07 Apr 2014 01:34:21	1110232	15626429	hadcm3n_zghi_1880_40_008246824_3	362,880	612,401	1.6876
06 Apr 2014 13:11:08	1110232	15626429	hadcm3n_zghi_1880_40_008246824_3	336,960	568,455	1.6870
06 Apr 2014 00:52:44	1110232	15626429	hadcm3n_zghi_1880_40_008246824_3	311,040	524,801	1.6872
05 Apr 2014 12:41:11	1110232	15626429	hadcm3n_zghi_1880_40_008246824_3	285,120	481,638	1.6892
05 Apr 2014 00:33:33	1110232	15626429	hadcm3n_zghi_1880_40_008246824_3	259,200	438,557	1.6920
04 Apr 2014 12:05:36	1110232	15626429	hadcm3n_zghi_1880_40_008246824_3	233,280	394,358	1.6905
03 Apr 2014 23:38:05	1110232	15626429	hadcm3n_zghi_1880_40_008246824_3	207,360	350,738	1.6914
03 Apr 2014 11:06:31	1110232	15626429	hadcm3n_zghi_1880_40_008246824_3	181,440	306,395	1.6887
02 Apr 2014 22:36:25	1110232	15626429	hadcm3n_zghi_1880_40_008246824_3	155,520	262,115	1.6854
02 Apr 2014 10:22:20	1110232	15626429	hadcm3n_zghi_1880_40_008246824_3	129,600	218,369	1.6849
25 Feb 2013 02:42:34	1110232	15626429	hadcm3n_zghi_1880_40_008246824_3	103,680	174,478	1.6829
24 Feb 2013 14:10:40	1110232	15626429	hadcm3n_zghi_1880_40_008246824_3	77,760	130,771	1.6817
24 Feb 2013 01:42:36	1110232	15626429	hadcm3n_zghi_1880_40_008246824_3	51,840	87,073	1.6796
23 Feb 2013 13:25:15	1110232	15626429	hadcm3n_zghi_1880_40_008246824_3	25,920	43,524	1.6792