Task 13557162

Name	hadcm3n_yblg_1900_40_007525705_0
Workunit	7723180
Created	28 Oct 2011, 13:42:16 UTC
Sent	30 Oct 2011, 0:13:14 UTC
Report deadline	29 Jan 2012, 7:40:25 UTC
Received	7 Dec 2011, 17:02:50 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1171759
Run time	11 days 7 hours 25 min 1 sec
CPU time	10 days 1 hours 9 min 15 sec
Validate state	Invalid
Credit	7,776.00
Device peak FLOPS	2.81 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.12.34</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 01:00:46 (1908): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 21:38:05 (3988): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 21:48:15 (3372): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 16:14:09 (3408): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 21:04:48 (3256): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... 20:18:37 (4748): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 20:30:37 (3516): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 20:31:43 (4396): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5864, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5864, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
07 Dec 2011 12:33:01	1171759	13557162	hadcm3n_yblg_1900_40_007525705_0	648,000	944,174	1.4571
07 Dec 2011 02:23:38	1171759	13557162	hadcm3n_yblg_1900_40_007525705_0	622,080	907,021	1.4580
06 Dec 2011 16:02:14	1171759	13557162	hadcm3n_yblg_1900_40_007525705_0	596,160	868,697	1.4572
06 Dec 2011 02:22:44	1171759	13557162	hadcm3n_yblg_1900_40_007525705_0	570,240	830,239	1.4559
04 Dec 2011 10:40:25	1171759	13557162	hadcm3n_yblg_1900_40_007525705_0	544,320	790,437	1.4522
03 Dec 2011 16:13:09	1171759	13557162	hadcm3n_yblg_1900_40_007525705_0	518,400	751,064	1.4488
03 Dec 2011 03:55:11	1171759	13557162	hadcm3n_yblg_1900_40_007525705_0	492,480	712,265	1.4463
02 Dec 2011 09:27:09	1171759	13557162	hadcm3n_yblg_1900_40_007525705_0	466,560	674,167	1.4450
01 Dec 2011 23:04:19	1171759	13557162	hadcm3n_yblg_1900_40_007525705_0	440,640	635,496	1.4422
01 Dec 2011 12:02:15	1171759	13557162	hadcm3n_yblg_1900_40_007525705_0	414,720	596,385	1.4380
01 Dec 2011 00:12:43	1171759	13557162	hadcm3n_yblg_1900_40_007525705_0	388,800	557,011	1.4326
30 Nov 2011 13:17:53	1171759	13557162	hadcm3n_yblg_1900_40_007525705_0	362,880	518,596	1.4291
30 Nov 2011 02:39:40	1171759	13557162	hadcm3n_yblg_1900_40_007525705_0	336,960	481,731	1.4296
29 Nov 2011 14:17:12	1171759	13557162	hadcm3n_yblg_1900_40_007525705_0	311,040	444,730	1.4298
29 Nov 2011 03:39:28	1171759	13557162	hadcm3n_yblg_1900_40_007525705_0	285,120	407,109	1.4279
24 Nov 2011 23:08:15	1171759	13557162	hadcm3n_yblg_1900_40_007525705_0	259,200	369,687	1.4263
15 Nov 2011 19:52:01	1171759	13557162	hadcm3n_yblg_1900_40_007525705_0	233,280	332,652	1.4260
15 Nov 2011 19:52:01	1171759	13557162	hadcm3n_yblg_1900_40_007525705_0	207,360	295,336	1.4243
15 Nov 2011 19:52:01	1171759	13557162	hadcm3n_yblg_1900_40_007525705_0	181,440	258,942	1.4271
09 Nov 2011 08:25:23	1171759	13557162	hadcm3n_yblg_1900_40_007525705_0	155,520	221,709	1.4256