Task 13346944

Name	hadcm3n_t01z_1940_40_007442612_0
Workunit	7640115
Created	8 Sep 2011, 21:47:51 UTC
Sent	8 Sep 2011, 21:48:23 UTC
Report deadline	9 Dec 2011, 5:15:34 UTC
Received	2 Nov 2011, 19:50:17 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	-2 (0xFFFFFFFE) Unknown error code
Computer ID	585872
Run time	16 days 6 hours 1 min 3 sec
CPU time	12 days 20 hours 17 min 22 sec
Validate state	Invalid
Credit	9,331.20
Device peak FLOPS	2.93 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.43</core_client_version> <![CDATA[ <message> - exit code -2 (0xfffffffe) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... OPEN: Unable to Open File dataout/t01zka.daf17m0 for Read/Write Model crashed: DUMPCTL : Fail to open output dump - may already exist tmp/pipe_dummy 2048 Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2248, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Atmos Hold Restart file rename failed on atmos_restart.hold Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 07:47:17 (4576): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - No 'heartbeat' from BOINC... 07:47:20 (4576): No heartbeat from core client for 30 sec - exiting 07:47:21 (4576): No heartbeat from core client for 30 sec - exiting 07:47:22 (4576): No heartbeat from core client for 30 sec - exiting 07:47:23 (4576): No heartbeat from core client for 30 sec - exiting 07:47:24 (4576): No heartbeat from core client for 30 sec - exiting 07:47:25 (4576): No heartbeat from core client for 30 sec - exiting 07:47:26 (4576): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... OPEN: Unable to Open File dataout/t01zka.pdh1c10 for Read/Write Model crashed: STWORK : Error opening output PP file on unit 63 tmp/pipe_dummy 2048 Suspended CPDN Monitor - Suspend request from BOINC... 09:19:42 (1540): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - No 'heartbeat' from BOINC... Could not launch model process. Last Error=193 Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
02 Nov 2011 19:58:34	585872	13346944	hadcm3n_t01z_1940_40_007442612_0	777,600	1,085,757	1.3963
02 Nov 2011 19:58:34	585872	13346944	hadcm3n_t01z_1940_40_007442612_0	751,680	1,050,052	1.3969
16 Oct 2011 22:36:37	585872	13346944	hadcm3n_t01z_1940_40_007442612_0	725,760	1,008,897	1.3901
16 Oct 2011 22:36:37	585872	13346944	hadcm3n_t01z_1940_40_007442612_0	699,840	967,462	1.3824
16 Oct 2011 22:36:37	585872	13346944	hadcm3n_t01z_1940_40_007442612_0	673,920	926,064	1.3741
16 Oct 2011 22:36:37	585872	13346944	hadcm3n_t01z_1940_40_007442612_0	648,000	884,753	1.3654
11 Oct 2011 20:07:44	585872	13346944	hadcm3n_t01z_1940_40_007442612_0	622,080	843,492	1.3559
11 Oct 2011 20:07:44	585872	13346944	hadcm3n_t01z_1940_40_007442612_0	596,160	802,748	1.3465
11 Oct 2011 20:07:44	585872	13346944	hadcm3n_t01z_1940_40_007442612_0	570,240	762,158	1.3366
01 Oct 2011 18:32:54	585872	13346944	hadcm3n_t01z_1940_40_007442612_0	544,320	721,445	1.3254
30 Sep 2011 18:27:07	585872	13346944	hadcm3n_t01z_1940_40_007442612_0	518,400	681,216	1.3141
30 Sep 2011 18:27:07	585872	13346944	hadcm3n_t01z_1940_40_007442612_0	492,480	640,863	1.3013
30 Sep 2011 18:27:07	585872	13346944	hadcm3n_t01z_1940_40_007442612_0	466,560	600,307	1.2867
30 Sep 2011 18:27:07	585872	13346944	hadcm3n_t01z_1940_40_007442612_0	440,640	559,516	1.2698
30 Sep 2011 18:27:07	585872	13346944	hadcm3n_t01z_1940_40_007442612_0	414,720	518,819	1.2510
22 Sep 2011 18:30:31	585872	13346944	hadcm3n_t01z_1940_40_007442612_0	388,800	478,417	1.2305
22 Sep 2011 06:16:07	585872	13346944	hadcm3n_t01z_1940_40_007442612_0	362,880	438,014	1.2070
22 Sep 2011 06:16:07	585872	13346944	hadcm3n_t01z_1940_40_007442612_0	336,960	399,279	1.1849
22 Sep 2011 06:16:07	585872	13346944	hadcm3n_t01z_1940_40_007442612_0	311,040	359,617	1.1562
19 Sep 2011 07:01:39	585872	13346944	hadcm3n_t01z_1940_40_007442612_0	285,120	318,079	1.1156