Task 13129228

Name	hadcm3n_yn0b_1900_40_007362677_1
Workunit	7560107
Created	6 Jul 2011, 15:27:13 UTC
Sent	6 Jul 2011, 18:11:57 UTC
Report deadline	6 Oct 2011, 1:39:08 UTC
Received	18 Aug 2011, 14:19:54 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	193 (0x000000C1) EXIT_SIGNAL
Computer ID	1376550
Run time	37 days 22 hours 59 min 47 sec
CPU time	36 days 22 hours 0 min 38 sec
Validate state	Invalid
Credit	12,441.60
Device peak FLOPS	1.67 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.58</core_client_version> <![CDATA[ <message> - exit code 193 (0xc1) </message> <stderr_txt> 07:14:46 (4168): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2124, iMonCtr=1 Model crash detected, will try to restart... 06:44:40 (5756): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 19:36:49 (1100): Can't acquire lockfile (32) - waiting 35s 19:37:01 (3496): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1100, iMonCtr=1 Model crash detected, will try to restart... 12:36:18 (6920): No heartbeat from core client for 30 sec - exiting 12:36:20 (6920): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 12:36:21 (6920): No heartbeat from core client for 30 sec - exiting 12:36:22 (6920): No heartbeat from core client for 30 sec - exiting 12:36:23 (6920): No heartbeat from core client for 30 sec - exiting Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2300, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6912, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 06:39:15 (6332): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6568, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5292, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
18 Aug 2011 14:20:40	1119324	13129228	hadcm3n_yn0b_1900_40_007362677_1	1,036,800	3,189,626	3.0764
17 Aug 2011 07:00:42	1119324	13129228	hadcm3n_yn0b_1900_40_007362677_1	1,010,880	3,110,270	3.0768
15 Aug 2011 23:57:02	1119324	13129228	hadcm3n_yn0b_1900_40_007362677_1	984,960	3,025,533	3.0717
11 Aug 2011 00:08:38	1119324	13129228	hadcm3n_yn0b_1900_40_007362677_1	959,040	2,936,337	3.0617
10 Aug 2011 02:34:11	1119324	13129228	hadcm3n_yn0b_1900_40_007362677_1	933,120	2,859,067	3.0640
09 Aug 2011 05:02:33	1119324	13129228	hadcm3n_yn0b_1900_40_007362677_1	907,200	2,782,379	3.0670
08 Aug 2011 07:25:41	1119324	13129228	hadcm3n_yn0b_1900_40_007362677_1	881,280	2,705,327	3.0698
07 Aug 2011 10:40:18	1119324	13129228	hadcm3n_yn0b_1900_40_007362677_1	855,360	2,628,284	3.0727
06 Aug 2011 13:13:54	1119324	13129228	hadcm3n_yn0b_1900_40_007362677_1	829,440	2,551,430	3.0761
05 Aug 2011 12:39:40	1119324	13129228	hadcm3n_yn0b_1900_40_007362677_1	803,520	2,469,182	3.0730
04 Aug 2011 12:29:53	1119324	13129228	hadcm3n_yn0b_1900_40_007362677_1	777,600	2,381,600	3.0628
03 Aug 2011 13:01:45	1119324	13129228	hadcm3n_yn0b_1900_40_007362677_1	751,680	2,295,732	3.0541
02 Aug 2011 12:23:53	1119324	13129228	hadcm3n_yn0b_1900_40_007362677_1	725,760	2,211,400	3.0470
01 Aug 2011 11:39:49	1119324	13129228	hadcm3n_yn0b_1900_40_007362677_1	699,840	2,127,901	3.0406
31 Jul 2011 10:19:12	1119324	13129228	hadcm3n_yn0b_1900_40_007362677_1	673,920	2,044,514	3.0338
30 Jul 2011 13:25:18	1119324	13129228	hadcm3n_yn0b_1900_40_007362677_1	648,000	1,967,567	3.0364
29 Jul 2011 15:18:34	1119324	13129228	hadcm3n_yn0b_1900_40_007362677_1	622,080	1,890,188	3.0385
28 Jul 2011 17:26:35	1119324	13129228	hadcm3n_yn0b_1900_40_007362677_1	596,160	1,813,218	3.0415
27 Jul 2011 19:17:32	1119324	13129228	hadcm3n_yn0b_1900_40_007362677_1	570,240	1,736,787	3.0457
26 Jul 2011 22:00:11	1119324	13129228	hadcm3n_yn0b_1900_40_007362677_1	544,320	1,660,689	3.0509