Task 16289606

Name	hadcm3n_7gxw_1980_40_008433239_2
Workunit	8584095
Created	10 Feb 2014, 14:18:08 UTC
Sent	10 Feb 2014, 14:18:14 UTC
Report deadline	14 Aug 2023, 19:38:14 UTC
Received	19 Feb 2014, 1:08:23 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1308965
Run time	8 days 7 hours 23 min 45 sec
CPU time	7 days 11 hours 30 min 5 sec
Validate state	Invalid
Credit	6,842.88
Device peak FLOPS	3.60 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.2.33</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 05:19:26 (25592): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 16:40:37 (5208): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 20:23:38 (9856): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=19760, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=19760, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=19760, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=19760, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=19760, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=19760, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
18 Feb 2014 14:19:22	1308965	16289606	hadcm3n_7gxw_1980_40_008433239_2	570,240	625,413	1.0968
18 Feb 2014 12:03:17	1308965	16289606	hadcm3n_7gxw_1980_40_008433239_2	544,320	594,759	1.0927
18 Feb 2014 12:02:39	1308965	16289606	hadcm3n_7gxw_1980_40_008433239_2	518,400	566,435	1.0927
18 Feb 2014 12:01:36	1308965	16289606	hadcm3n_7gxw_1980_40_008433239_2	492,480	537,312	1.0910
18 Feb 2014 12:01:00	1308965	16289606	hadcm3n_7gxw_1980_40_008433239_2	466,560	510,089	1.0933
18 Feb 2014 12:01:00	1308965	16289606	hadcm3n_7gxw_1980_40_008433239_2	440,640	482,670	1.0954
16 Feb 2014 11:18:59	1308965	16289606	hadcm3n_7gxw_1980_40_008433239_2	414,720	454,938	1.0970
16 Feb 2014 02:57:49	1308965	16289606	hadcm3n_7gxw_1980_40_008433239_2	388,800	427,142	1.0986
15 Feb 2014 18:26:03	1308965	16289606	hadcm3n_7gxw_1980_40_008433239_2	362,880	398,146	1.0972
15 Feb 2014 08:36:46	1308965	16289606	hadcm3n_7gxw_1980_40_008433239_2	336,960	365,190	1.0838
15 Feb 2014 00:05:28	1308965	16289606	hadcm3n_7gxw_1980_40_008433239_2	311,040	336,378	1.0815
14 Feb 2014 14:27:09	1308965	16289606	hadcm3n_7gxw_1980_40_008433239_2	285,120	306,937	1.0765
14 Feb 2014 05:25:24	1308965	16289606	hadcm3n_7gxw_1980_40_008433239_2	259,200	278,517	1.0745
13 Feb 2014 19:18:25	1308965	16289606	hadcm3n_7gxw_1980_40_008433239_2	233,280	247,671	1.0617
13 Feb 2014 12:23:02	1308965	16289606	hadcm3n_7gxw_1980_40_008433239_2	207,360	222,544	1.0732
13 Feb 2014 05:11:55	1308965	16289606	hadcm3n_7gxw_1980_40_008433239_2	181,440	198,901	1.0962
12 Feb 2014 20:55:33	1308965	16289606	hadcm3n_7gxw_1980_40_008433239_2	155,520	170,428	1.0959
12 Feb 2014 11:27:00	1308965	16289606	hadcm3n_7gxw_1980_40_008433239_2	129,600	141,830	1.0944
12 Feb 2014 03:00:37	1308965	16289606	hadcm3n_7gxw_1980_40_008433239_2	103,680	113,846	1.0981
11 Feb 2014 18:38:40	1308965	16289606	hadcm3n_7gxw_1980_40_008433239_2	77,760	85,727	1.1025