Task 15359772

Name	hadcm3n_zhq3_1880_40_008201377_3
Workunit	8356501
Created	11 Oct 2012, 12:15:31 UTC
Sent	11 Oct 2012, 12:15:35 UTC
Report deadline	10 Jan 2013, 19:42:46 UTC
Received	13 Dec 2012, 21:49:26 UTC
Server state	Over
Outcome	Success
Client state	Done
Exit status	0 (0x00000000)
Computer ID	1157386
Run time	16 days 6 hours 42 min 17 sec
CPU time	16 days 4 hours 23 min 26 sec
Validate state	Valid
Credit	12,441.60
Device peak FLOPS	2.74 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <stderr_txt> Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3604, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1524, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4644, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4552, iMonCtr=1 Model crash detected, will try to restart... BUFFIN: C I/O Error feof - Unit 63 - Return code = 16 BUFFIN: C I/O Error feof - Unit 64 - Return code = 16 BUFFIN: C I/O Error feof - Unit 65 - Return code = 16 BUFFIN: C I/O Error feof - Unit 66 - Return code = 16 BUFFIN: C I/O Error feof - Unit 67 - Return code = 16 BUFFIN: C I/O Error feof - Unit 68 - Return code = 16 BUFFIN: C I/O Error feof - Unit 69 - Return code = 16 Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3820, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 18:47:24 (2696): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1952, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4668, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4788, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4664, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4664, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4664, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3216, iMonCtr=1 Model crash detected, will try to restart... 06:42:54 (3128): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 10:45:43 (4060): No heartbeat from core client for 30 sec - exiting 10:45:44 (4060): No heartbeat from core client for 30 sec - exiting 10:45:45 (4060): No heartbeat from core client for 30 sec - exiting 10:45:47 (4060): No heartbeat from core client for 30 sec - exiting 10:45:48 (4060): No heartbeat from core client for 30 sec - exiting 10:45:49 (4060): No heartbeat from core client for 30 sec - exiting 10:45:50 (4060): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 10:45:51 (4060): No heartbeat from core client for 30 sec - exiting 10:45:52 (4060): No heartbeat from core client for 30 sec - exiting 10:45:53 (4060): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4528, iMonCtr=1 Model crash detected, will try to restart... 19:01:27 (2976): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 07:33:36 (3188): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3620, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3872, iMonCtr=1 Model crash detected, will try to restart... 09:28:56 (2900): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 21:36:06 (4236): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 12:09:14 (724): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 12:09:15 (724): No heartbeat from core client for 30 sec - exiting 12:09:16 (724): No heartbeat from core client for 30 sec - exiting 12:19:12 (2692): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 16:53:19 (3808): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4292, iMonCtr=1 Model crash detected, will try to restart... 17:57:22 (456): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4116, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4544, iMonCtr=1 Model crash detected, will try to restart... 18:03:33 (4008): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 17:26:24 (3204): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 01:16:14 (4696): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
13 Dec 2012 21:52:14	1157386	15359772	hadcm3n_zhq3_1880_40_008201377_3	1,036,800	1,397,623	1.3480
13 Dec 2012 21:52:14	1157386	15359772	hadcm3n_zhq3_1880_40_008201377_3	1,010,880	1,361,837	1.3472
13 Dec 2012 21:52:14	1157386	15359772	hadcm3n_zhq3_1880_40_008201377_3	984,960	1,325,583	1.3458
06 Dec 2012 14:05:01	1157386	15359772	hadcm3n_zhq3_1880_40_008201377_3	959,040	1,288,806	1.3439
05 Dec 2012 09:04:29	1157386	15359772	hadcm3n_zhq3_1880_40_008201377_3	933,120	1,253,033	1.3428
04 Dec 2012 10:12:32	1157386	15359772	hadcm3n_zhq3_1880_40_008201377_3	907,200	1,216,378	1.3408
02 Dec 2012 12:19:18	1157386	15359772	hadcm3n_zhq3_1880_40_008201377_3	881,280	1,179,852	1.3388
30 Nov 2012 13:18:45	1157386	15359772	hadcm3n_zhq3_1880_40_008201377_3	855,360	1,143,478	1.3368
28 Nov 2012 13:07:52	1157386	15359772	hadcm3n_zhq3_1880_40_008201377_3	829,440	1,107,346	1.3351
27 Nov 2012 12:59:31	1157386	15359772	hadcm3n_zhq3_1880_40_008201377_3	803,520	1,070,677	1.3325
26 Nov 2012 08:20:01	1157386	15359772	hadcm3n_zhq3_1880_40_008201377_3	777,600	1,034,737	1.3307
25 Nov 2012 03:14:15	1157386	15359772	hadcm3n_zhq3_1880_40_008201377_3	751,680	1,000,059	1.3304
23 Nov 2012 08:35:33	1157386	15359772	hadcm3n_zhq3_1880_40_008201377_3	725,760	965,789	1.3307
22 Nov 2012 23:48:34	1157386	15359772	hadcm3n_zhq3_1880_40_008201377_3	699,840	931,171	1.3305
21 Nov 2012 10:43:50	1157386	15359772	hadcm3n_zhq3_1880_40_008201377_3	673,920	896,757	1.3307
20 Nov 2012 05:45:57	1157386	15359772	hadcm3n_zhq3_1880_40_008201377_3	648,000	862,534	1.3311
19 Nov 2012 11:49:00	1157386	15359772	hadcm3n_zhq3_1880_40_008201377_3	622,080	827,819	1.3307
18 Nov 2012 10:20:00	1157386	15359772	hadcm3n_zhq3_1880_40_008201377_3	596,160	793,596	1.3312
15 Nov 2012 13:24:53	1157386	15359772	hadcm3n_zhq3_1880_40_008201377_3	570,240	759,095	1.3312
15 Nov 2012 03:38:45	1157386	15359772	hadcm3n_zhq3_1880_40_008201377_3	544,320	724,291	1.3306