Task 16816425

Name	hadcm3n_88cq_1980_40_008720245_1
Workunit	8866223
Created	18 Jul 2014, 14:43:05 UTC
Sent	18 Jul 2014, 14:43:17 UTC
Report deadline	17 Oct 2014, 22:10:28 UTC
Received	7 Sep 2014, 18:24:09 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	193 (0x000000C1) EXIT_SIGNAL
Computer ID	1334117
Run time	21 days 9 hours 56 min 19 sec
CPU time	19 days 4 hours 4 min 42 sec
Validate state	Invalid
Credit	9,331.20
Device peak FLOPS	1.88 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.2.33</core_client_version> <![CDATA[ <message> (unknown error) - exit code 193 (0xc1) </message> <stderr_txt> 17:11:42 (3348): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3792, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3088, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=196, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3344, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3340, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1724, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2500, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3936, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1012, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3680, iMonCtr=1 Model crash detected, will try to restart... 15:11:45 (4116): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 15:14:29 (2328): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4028, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3020, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
07 Sep 2014 17:28:16	1334117	16816425	hadcm3n_88cq_1980_40_008720245_1	777,600	1,656,266	2.1300
06 Sep 2014 11:59:28	1334117	16816425	hadcm3n_88cq_1980_40_008720245_1	751,680	1,601,939	2.1311
04 Sep 2014 15:25:49	1334117	16816425	hadcm3n_88cq_1980_40_008720245_1	725,760	1,547,427	2.1321
03 Sep 2014 23:59:36	1334117	16816425	hadcm3n_88cq_1980_40_008720245_1	699,840	1,495,017	2.1362
03 Sep 2014 07:31:17	1334117	16816425	hadcm3n_88cq_1980_40_008720245_1	673,920	1,439,074	2.1354
02 Sep 2014 00:25:07	1334117	16816425	hadcm3n_88cq_1980_40_008720245_1	648,000	1,379,421	2.1287
30 Aug 2014 16:39:42	1334117	16816425	hadcm3n_88cq_1980_40_008720245_1	622,080	1,320,172	2.1222
29 Aug 2014 10:18:51	1334117	16816425	hadcm3n_88cq_1980_40_008720245_1	596,160	1,264,217	2.1206
29 Aug 2014 10:18:51	1334117	16816425	hadcm3n_88cq_1980_40_008720245_1	570,240	1,207,867	2.1182
24 Aug 2014 23:51:54	1334117	16816425	hadcm3n_88cq_1980_40_008720245_1	544,320	1,152,431	2.1172
22 Aug 2014 18:39:36	1334117	16816425	hadcm3n_88cq_1980_40_008720245_1	518,400	1,095,872	2.1140
20 Aug 2014 20:03:48	1334117	16816425	hadcm3n_88cq_1980_40_008720245_1	492,480	1,038,551	2.1088
19 Aug 2014 07:24:30	1334117	16816425	hadcm3n_88cq_1980_40_008720245_1	466,560	981,627	2.1040
17 Aug 2014 06:29:49	1334117	16816425	hadcm3n_88cq_1980_40_008720245_1	440,640	923,228	2.0952
15 Aug 2014 01:50:36	1334117	16816425	hadcm3n_88cq_1980_40_008720245_1	414,720	867,255	2.0912
14 Aug 2014 20:57:09	1334117	16816425	hadcm3n_88cq_1980_40_008720245_1	388,800	812,227	2.0891
14 Aug 2014 20:57:09	1334117	16816425	hadcm3n_88cq_1980_40_008720245_1	362,880	758,224	2.0895
14 Aug 2014 20:57:09	1334117	16816425	hadcm3n_88cq_1980_40_008720245_1	336,960	703,781	2.0886
06 Aug 2014 21:40:58	1334117	16816425	hadcm3n_88cq_1980_40_008720245_1	311,040	650,812	2.0924
06 Aug 2014 20:39:39	1334117	16816425	hadcm3n_88cq_1980_40_008720245_1	285,120	597,637	2.0961