Task 15773445

Name	hadcm3n_zhcj_1960_40_008364086_0
Workunit	8514945
Created	10 May 2013, 19:07:44 UTC
Sent	10 May 2013, 19:08:03 UTC
Report deadline	10 Aug 2013, 2:35:14 UTC
Received	29 Jul 2013, 13:53:41 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	193 (0x000000C1) EXIT_SIGNAL
Computer ID	1270260
Run time	67 days 2 hours 34 min 12 sec
CPU time	66 days 17 hours 31 min 31 sec
Validate state	Invalid
Credit	9,331.20
Device peak FLOPS	0.70 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.64</core_client_version> <![CDATA[ <message> (unknown error) - exit code 193 (0xc1) </message> <stderr_txt> Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4012, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2032, iMonCtr=1 Model crash detected, will try to restart... 03:46:12 (2296): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 10:07:25 (2944): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 00:35:09 (3804): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 21:18:40 (1324): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 13:48:23 (1556): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 13:48:24 (1556): No heartbeat from core client for 30 sec - exiting 21:46:08 (1960): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 15:58:17 (4616): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 22:56:56 (4144): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2564, iMonCtr=1 Model crash detected, will try to restart... 22:51:05 (2328): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 22:51:46 (2188): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 07:23:03 (2796): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 08:07:12 (3112): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 08:07:13 (3112): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... 16:51:02 (2492): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 16:51:06 (2492): No heartbeat from core client for 30 sec - exiting 16:51:07 (2492): No heartbeat from core client for 30 sec - exiting 16:52:16 (6072): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 17:19:38 (5996): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 17:19:42 (5996): No heartbeat from core client for 30 sec - exiting 17:20:37 (1928): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 18:19:40 (480): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 18:19:41 (480): No heartbeat from core client for 30 sec - exiting 18:42:51 (6072): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 18:42:52 (6072): No heartbeat from core client for 30 sec - exiting 21:18:24 (2264): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 21:18:25 (2264): No heartbeat from core client for 30 sec - exiting 21:18:26 (2264): No heartbeat from core client for 30 sec - exiting 22:18:05 (1344): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 22:18:07 (1344): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... 04:05:01 (4804): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 04:05:05 (4804): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... 19:17:26 (5844): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 19:17:31 (5844): No heartbeat from core client for 30 sec - exiting 19:17:32 (5844): No heartbeat from core client for 30 sec - exiting 19:17:33 (5844): No heartbeat from core client for 30 sec - exiting 19:17:35 (5844): No heartbeat from core client for 30 sec - exiting 19:17:36 (5844): No heartbeat from core client for 30 sec - exiting 19:17:37 (5844): No heartbeat from core client for 30 sec - exiting 19:17:38 (5844): No heartbeat from core client for 30 sec - exiting 19:17:39 (5844): No heartbeat from core client for 30 sec - exiting 19:17:40 (5844): No heartbeat from core client for 30 sec - exiting 19:17:41 (5844): No heartbeat from core client for 30 sec - exiting 19:17:42 (5844): No heartbeat from core client for 30 sec - exiting 19:17:43 (5844): No heartbeat from core client for 30 sec - exiting 19:17:44 (5844): No heartbeat from core client for 30 sec - exiting 19:17:45 (5844): No heartbeat from core client for 30 sec - exiting 19:17:47 (5844): No heartbeat from core client for 30 sec - exiting 19:19:25 (4804): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 02:59:50 (4636): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 02:59:51 (4636): No heartbeat from core client for 30 sec - exiting 07:11:50 (2044): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 09:21:39 (5912): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 05:44:54 (1280): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 03:14:00 (564): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 11 received, exiting... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
29 Jul 2013 14:04:05	1270260	15773445	hadcm3n_zhcj_1960_40_008364086_0	777,600	5,765,484	7.4145
25 Jul 2013 21:02:05	1270260	15773445	hadcm3n_zhcj_1960_40_008364086_0	751,680	5,573,778	7.4151
23 Jul 2013 22:13:07	1270260	15773445	hadcm3n_zhcj_1960_40_008364086_0	725,760	5,384,058	7.4185
23 Jul 2013 20:52:36	1270260	15773445	hadcm3n_zhcj_1960_40_008364086_0	699,840	5,191,956	7.4188
23 Jul 2013 14:38:51	1270260	15773445	hadcm3n_zhcj_1960_40_008364086_0	673,920	4,995,238	7.4122
23 Jul 2013 14:38:51	1270260	15773445	hadcm3n_zhcj_1960_40_008364086_0	648,000	4,801,624	7.4099
11 Jul 2013 03:03:29	1270260	15773445	hadcm3n_zhcj_1960_40_008364086_0	622,080	4,611,367	7.4128
08 Jul 2013 21:40:35	1270260	15773445	hadcm3n_zhcj_1960_40_008364086_0	596,160	4,420,589	7.4151
06 Jul 2013 16:14:32	1270260	15773445	hadcm3n_zhcj_1960_40_008364086_0	570,240	4,230,490	7.4188
04 Jul 2013 14:27:01	1270260	15773445	hadcm3n_zhcj_1960_40_008364086_0	544,320	4,040,224	7.4225
02 Jul 2013 12:04:39	1270260	15773445	hadcm3n_zhcj_1960_40_008364086_0	518,400	3,846,930	7.4208
02 Jul 2013 10:22:49	1270260	15773445	hadcm3n_zhcj_1960_40_008364086_0	492,480	3,653,965	7.4195
27 Jun 2013 17:38:36	1270260	15773445	hadcm3n_zhcj_1960_40_008364086_0	466,560	3,460,197	7.4164
25 Jun 2013 11:57:38	1270260	15773445	hadcm3n_zhcj_1960_40_008364086_0	440,640	3,267,642	7.4157
23 Jun 2013 06:35:49	1270260	15773445	hadcm3n_zhcj_1960_40_008364086_0	414,720	3,076,019	7.4171
21 Jun 2013 01:14:42	1270260	15773445	hadcm3n_zhcj_1960_40_008364086_0	388,800	2,884,687	7.4195
18 Jun 2013 20:14:01	1270260	15773445	hadcm3n_zhcj_1960_40_008364086_0	362,880	2,694,206	7.4245
16 Jun 2013 15:03:29	1270260	15773445	hadcm3n_zhcj_1960_40_008364086_0	336,960	2,503,883	7.4308
14 Jun 2013 09:43:00	1270260	15773445	hadcm3n_zhcj_1960_40_008364086_0	311,040	2,313,329	7.4374
11 Jun 2013 23:11:04	1270260	15773445	hadcm3n_zhcj_1960_40_008364086_0	285,120	2,120,157	7.4360