Task 13638687

Name	hadcm3n_o4lg_1940_40_007543555_2
Workunit	7740787
Created	16 Nov 2011, 8:13:07 UTC
Sent	16 Nov 2011, 8:13:31 UTC
Report deadline	15 Feb 2012, 15:40:42 UTC
Received	5 Apr 2012, 16:21:20 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	496445
Run time	37 days 10 hours 38 min 33 sec
CPU time	37 days 10 hours 38 min 33 sec
Validate state	Invalid
Credit	9,331.20
Device peak FLOPS	1.40 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>5.4.11</core_client_version> <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> 17:49:50 (3052): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 21:11:42 (1056): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 CPDN Monitor - Quit request from BOINC... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2580, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2580, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2580, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2580, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2580, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2580, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
04 Apr 2012 19:38:27	496445	13638687	hadcm3n_o4lg_1940_40_007543555_2	777,600	3,162,689	4.0672
03 Apr 2012 11:17:02	496445	13638687	hadcm3n_o4lg_1940_40_007543555_2	751,680	3,323,595	4.4216
02 Apr 2012 02:52:33	496445	13638687	hadcm3n_o4lg_1940_40_007543555_2	725,760	3,209,217	4.4219
31 Mar 2012 18:33:24	496445	13638687	hadcm3n_o4lg_1940_40_007543555_2	699,840	3,094,960	4.4224
30 Mar 2012 10:07:54	496445	13638687	hadcm3n_o4lg_1940_40_007543555_2	673,920	2,980,686	4.4229
29 Mar 2012 01:52:26	496445	13638687	hadcm3n_o4lg_1940_40_007543555_2	648,000	2,866,661	4.4239
27 Mar 2012 17:41:13	496445	13638687	hadcm3n_o4lg_1940_40_007543555_2	622,080	2,752,741	4.4251
26 Mar 2012 09:21:56	496445	13638687	hadcm3n_o4lg_1940_40_007543555_2	596,160	2,638,668	4.4261
25 Mar 2012 01:01:19	496445	13638687	hadcm3n_o4lg_1940_40_007543555_2	570,240	2,524,535	4.4271
23 Mar 2012 16:34:33	496445	13638687	hadcm3n_o4lg_1940_40_007543555_2	544,320	2,409,596	4.4268
22 Mar 2012 08:05:21	496445	13638687	hadcm3n_o4lg_1940_40_007543555_2	518,400	2,294,721	4.4265
20 Mar 2012 23:39:35	496445	13638687	hadcm3n_o4lg_1940_40_007543555_2	492,480	2,180,328	4.4272
19 Mar 2012 15:09:14	496445	13638687	hadcm3n_o4lg_1940_40_007543555_2	466,560	2,065,903	4.4279
18 Mar 2012 06:08:40	496445	13638687	hadcm3n_o4lg_1940_40_007543555_2	440,640	1,949,542	4.4243
16 Mar 2012 21:11:15	496445	13638687	hadcm3n_o4lg_1940_40_007543555_2	414,720	1,833,696	4.4215
15 Mar 2012 12:20:54	496445	13638687	hadcm3n_o4lg_1940_40_007543555_2	388,800	1,718,298	4.4195
14 Mar 2012 03:44:04	496445	13638687	hadcm3n_o4lg_1940_40_007543555_2	362,880	1,603,576	4.4190
12 Mar 2012 19:17:52	496445	13638687	hadcm3n_o4lg_1940_40_007543555_2	336,960	1,487,866	4.4156
11 Mar 2012 10:21:41	496445	13638687	hadcm3n_o4lg_1940_40_007543555_2	311,040	1,372,805	4.4136
10 Mar 2012 01:09:17	496445	13638687	hadcm3n_o4lg_1940_40_007543555_2	285,120	1,255,644	4.4039