Task 14795563

Name	hadcm3n_ycr1_1940_40_007832372_3
Workunit	7987484
Created	18 Jun 2012, 0:43:52 UTC
Sent	18 Jun 2012, 0:43:53 UTC
Report deadline	17 Sep 2012, 8:11:04 UTC
Received	3 Dec 2012, 17:30:07 UTC
Server state	Over
Outcome	Computation error
Client state	Aborted by user
Exit status	-197 (0xFFFFFF3B) ERR_ABORTED_VIA_GUI
Computer ID	1085873
Run time	28 days 1 hours 26 min 27 sec
CPU time	20 days 15 hours 14 min 10 sec
Validate state	Invalid
Credit	11,197.44
Device peak FLOPS	2.47 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.58</core_client_version> <![CDATA[ <message> aborted by user </message> <stderr_txt> Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=10004, iMonCtr=1 Model crash detected, will try to restart... 02:14:31 (6576): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=9892, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... 02:06:19 (1612): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7828, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... 07:34:12 (5340): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 17:13:46 (9700): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=11600, iMonCtr=1 Model crash detected, will try to restart... BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 00:59:30 (7528): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 22:39:06 (9240): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 00:47:51 (5180): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 00:47:52 (5180): No heartbeat from core client for 30 sec - exiting 01:21:11 (10652): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 18:16:59 (9548): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 20:29:23 (15748): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 21:48:06 (11876): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=16728, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6768, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Abort request from BOINC... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
01 Oct 2012 22:34:16	1085873	14795563	hadcm3n_ycr1_1940_40_007832372_3	933,120	1,768,587	1.8953
30 Sep 2012 01:05:02	1085873	14795563	hadcm3n_ycr1_1940_40_007832372_3	907,200	1,718,288	1.8941
23 Sep 2012 12:37:02	1085873	14795563	hadcm3n_ycr1_1940_40_007832372_3	881,280	1,669,000	1.8938
22 Sep 2012 16:14:35	1085873	14795563	hadcm3n_ycr1_1940_40_007832372_3	855,360	1,619,653	1.8935
19 Sep 2012 11:38:49	1085873	14795563	hadcm3n_ycr1_1940_40_007832372_3	829,440	1,570,547	1.8935
17 Sep 2012 05:59:35	1085873	14795563	hadcm3n_ycr1_1940_40_007832372_3	803,520	1,521,539	1.8936
16 Sep 2012 10:19:54	1085873	14795563	hadcm3n_ycr1_1940_40_007832372_3	777,600	1,471,937	1.8929
15 Sep 2012 14:58:56	1085873	14795563	hadcm3n_ycr1_1940_40_007832372_3	751,680	1,422,022	1.8918
13 Sep 2012 08:32:05	1085873	14795563	hadcm3n_ycr1_1940_40_007832372_3	725,760	1,373,354	1.8923
12 Sep 2012 00:07:33	1085873	14795563	hadcm3n_ycr1_1940_40_007832372_3	699,840	1,324,271	1.8922
16 Aug 2012 05:00:07	1085873	14795563	hadcm3n_ycr1_1940_40_007832372_3	673,920	1,283,893	1.9051
15 Aug 2012 06:29:34	1085873	14795563	hadcm3n_ycr1_1940_40_007832372_3	648,000	1,234,633	1.9053
12 Aug 2012 20:46:14	1085873	14795563	hadcm3n_ycr1_1940_40_007832372_3	622,080	1,185,526	1.9057
12 Aug 2012 02:54:12	1085873	14795563	hadcm3n_ycr1_1940_40_007832372_3	596,160	1,135,490	1.9047
11 Aug 2012 08:41:52	1085873	14795563	hadcm3n_ycr1_1940_40_007832372_3	570,240	1,085,508	1.9036
10 Aug 2012 15:22:55	1085873	14795563	hadcm3n_ycr1_1940_40_007832372_3	544,320	1,035,151	1.9017
08 Aug 2012 03:10:48	1085873	14795563	hadcm3n_ycr1_1940_40_007832372_3	518,400	985,624	1.9013
04 Aug 2012 00:49:26	1085873	14795563	hadcm3n_ycr1_1940_40_007832372_3	492,480	934,920	1.8984
03 Aug 2012 06:56:11	1085873	14795563	hadcm3n_ycr1_1940_40_007832372_3	466,560	883,548	1.8938
02 Aug 2012 12:47:27	1085873	14795563	hadcm3n_ycr1_1940_40_007832372_3	440,640	832,802	1.8900