Task 16133536

Name	hadcm3n_83jl_1980_40_008462532_2
Workunit	8613388
Created	6 Dec 2013, 0:18:00 UTC
Sent	6 Dec 2013, 0:32:48 UTC
Report deadline	7 Mar 2014, 7:59:59 UTC
Received	19 Dec 2013, 10:24:00 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1193059
Run time	12 days 9 hours 37 min 58 sec
CPU time	12 days 9 hours 22 min 29 sec
Validate state	Invalid
Credit	7,776.00
Device peak FLOPS	2.56 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.2.33</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 16:57:10 (5576): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 17:30:46 (4484): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 19:06:22 (5712): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6752, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6752, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6752, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6752, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6752, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6752, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
18 Dec 2013 16:58:50	1193059	16133536	hadcm3n_83jl_1980_40_008462532_2	648,000	1,032,409	1.5932
18 Dec 2013 03:45:28	1193059	16133536	hadcm3n_83jl_1980_40_008462532_2	622,080	990,389	1.5921
17 Dec 2013 15:42:10	1193059	16133536	hadcm3n_83jl_1980_40_008462532_2	596,160	947,040	1.5886
17 Dec 2013 03:19:35	1193059	16133536	hadcm3n_83jl_1980_40_008462532_2	570,240	902,546	1.5827
16 Dec 2013 15:41:02	1193059	16133536	hadcm3n_83jl_1980_40_008462532_2	544,320	860,650	1.5811
16 Dec 2013 03:32:07	1193059	16133536	hadcm3n_83jl_1980_40_008462532_2	518,400	818,357	1.5786
15 Dec 2013 15:57:01	1193059	16133536	hadcm3n_83jl_1980_40_008462532_2	492,480	776,284	1.5763
15 Dec 2013 03:50:15	1193059	16133536	hadcm3n_83jl_1980_40_008462532_2	466,560	733,199	1.5715
14 Dec 2013 16:14:42	1193059	16133536	hadcm3n_83jl_1980_40_008462532_2	440,640	691,493	1.5693
14 Dec 2013 05:04:29	1193059	16133536	hadcm3n_83jl_1980_40_008462532_2	414,720	649,814	1.5669
13 Dec 2013 17:14:42	1193059	16133536	hadcm3n_83jl_1980_40_008462532_2	388,800	608,726	1.5657
13 Dec 2013 05:37:28	1193059	16133536	hadcm3n_83jl_1980_40_008462532_2	362,880	566,829	1.5620
12 Dec 2013 18:43:53	1193059	16133536	hadcm3n_83jl_1980_40_008462532_2	336,960	524,913	1.5578
12 Dec 2013 03:49:01	1193059	16133536	hadcm3n_83jl_1980_40_008462532_2	311,040	485,270	1.5602
11 Dec 2013 15:05:56	1193059	16133536	hadcm3n_83jl_1980_40_008462532_2	285,120	444,894	1.5604
11 Dec 2013 03:06:12	1193059	16133536	hadcm3n_83jl_1980_40_008462532_2	259,200	401,262	1.5481
10 Dec 2013 16:09:40	1193059	16133536	hadcm3n_83jl_1980_40_008462532_2	233,280	359,619	1.5416
10 Dec 2013 02:29:20	1193059	16133536	hadcm3n_83jl_1980_40_008462532_2	207,360	319,969	1.5431
09 Dec 2013 15:36:43	1193059	16133536	hadcm3n_83jl_1980_40_008462532_2	181,440	281,961	1.5540
09 Dec 2013 00:11:57	1193059	16133536	hadcm3n_83jl_1980_40_008462532_2	155,520	242,532	1.5595