Task 16577245

Name	hadcm3n_87og_1980_40_008603398_3
Workunit	8749910
Created	21 Apr 2014, 17:44:57 UTC
Sent	21 Apr 2014, 17:46:08 UTC
Report deadline	22 Jul 2014, 1:13:19 UTC
Received	15 Jun 2014, 18:55:37 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1265124
Run time	18 days 0 hours 34 min 10 sec
CPU time	10 days 9 hours 40 min 15 sec
Validate state	Invalid
Credit	5,598.72
Device peak FLOPS	2.61 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.2.42</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> 14:01:34 (23268): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 20:28:00 (24648): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 20:28:01 (24648): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 17:15:05 (3996): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 17:15:06 (3996): No heartbeat from core client for 30 sec - exiting 17:15:08 (3996): No heartbeat from core client for 30 sec - exiting 17:15:09 (3996): No heartbeat from core client for 30 sec - exiting 17:15:10 (3996): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=28680, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=28680, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=28680, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=28680, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=28680, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=28680, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
15 Jun 2014 17:57:02	1265124	16577245	hadcm3n_87og_1980_40_008603398_3	466,560	1,278,464	2.7402
14 Jun 2014 23:25:30	1265124	16577245	hadcm3n_87og_1980_40_008603398_3	440,640	1,214,037	2.7552
14 Jun 2014 04:58:45	1265124	16577245	hadcm3n_87og_1980_40_008603398_3	414,720	1,149,674	2.7722
13 Jun 2014 10:27:00	1265124	16577245	hadcm3n_87og_1980_40_008603398_3	388,800	1,085,479	2.7919
12 Jun 2014 16:00:25	1265124	16577245	hadcm3n_87og_1980_40_008603398_3	362,880	1,021,176	2.8141
11 Jun 2014 20:13:12	1265124	16577245	hadcm3n_87og_1980_40_008603398_3	336,960	955,563	2.8358
10 Jun 2014 18:50:37	1265124	16577245	hadcm3n_87og_1980_40_008603398_3	311,040	883,248	2.8397
10 Jun 2014 09:03:40	1265124	16577245	hadcm3n_87og_1980_40_008603398_3	285,120	810,060	2.8411
10 Jun 2014 09:02:06	1265124	16577245	hadcm3n_87og_1980_40_008603398_3	259,200	736,880	2.8429
10 Jun 2014 02:22:18	1265124	16577245	hadcm3n_87og_1980_40_008603398_3	233,280	663,501	2.8442
06 Jun 2014 12:33:20	1265124	16577245	hadcm3n_87og_1980_40_008603398_3	207,360	590,238	2.8464
05 Jun 2014 10:30:01	1265124	16577245	hadcm3n_87og_1980_40_008603398_3	181,440	517,052	2.8497
04 Jun 2014 09:06:07	1265124	16577245	hadcm3n_87og_1980_40_008603398_3	155,520	444,152	2.8559
03 Jun 2014 07:46:28	1265124	16577245	hadcm3n_87og_1980_40_008603398_3	129,600	371,050	2.8630
01 May 2014 15:27:19	1265124	16577245	hadcm3n_87og_1980_40_008603398_3	103,680	297,503	2.8694
30 Apr 2014 12:53:29	1265124	16577245	hadcm3n_87og_1980_40_008603398_3	77,760	223,260	2.8711
24 Apr 2014 00:08:12	1265124	16577245	hadcm3n_87og_1980_40_008603398_3	51,840	149,283	2.8797
22 Apr 2014 21:03:14	1265124	16577245	hadcm3n_87og_1980_40_008603398_3	25,920	74,551	2.8762