Task 12229265

Name	hadam3p_saf_1g3j_1990_1_006948695_0
Workunit	7152011
Created	22 Nov 2010, 16:41:02 UTC
Sent	8 Mar 2011, 21:00:17 UTC
Report deadline	19 Feb 2012, 2:20:17 UTC
Received	27 Mar 2011, 23:10:13 UTC
Server state	Over
Outcome	Didn't need
Client state	Done
Exit status	0 (0x00000000)
Computer ID	1062020
Run time	8 days 7 hours 6 min 44 sec
CPU time	5 days 15 hours 25 min 56 sec
Validate state	Initial
Credit	2,244.09
Device peak FLOPS	1.83 GFLOPS
Application version	UK Met Office HadAM3P-HadRM3P Southern Africa v6.08 windows_intelx86
Stderr	<core_client_version>6.10.18</core_client_version> <![CDATA[ <stderr_txt> Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=3264, selfPID=5068, iMonCtr=1 Model crash detected, will try to restart... Leaving CPDN_Main::Monitor... 23:17:29 (4616): No heartbeat from core client for 30 sec - exiting 23:17:30 (4616): No heartbeat from core client for 30 sec - exiting 23:17:31 (4616): No heartbeat from core client for 30 sec - exiting 23:17:32 (4616): No heartbeat from core client for 30 sec - exiting 23:17:33 (4616): No heartbeat from core client for 30 sec - exiting 23:17:35 (4616): No heartbeat from core client for 30 sec - exiting 23:17:36 (4616): No heartbeat from core client for 30 sec - exiting 23:17:37 (4616): No heartbeat from core client for 30 sec - exiting 23:17:38 (4616): No heartbeat from core client for 30 sec - exiting 23:17:39 (4616): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6956, iMonCtr=2 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Regional Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=5064, selfPID=5064, iMonCtr=2 CPDN Monitor - Quit request from BOINC... Regional Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=7216, selfPID=7216, iMonCtr=2 Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=4580, selfPID=6800, iMonCtr=1 Model crash detected, will try to restart... Leaving CPDN_Main::Monitor... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=2204, selfPID=1288, iMonCtr=1 Model crash detected, will try to restart... Leaving CPDN_Main::Monitor... CPDN Monitor - Quit request from BOINC... 15:20:10 (5412): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 15:20:12 (5412): No heartbeat from core client for 30 sec - exiting 15:20:13 (5412): No heartbeat from core client for 30 sec - exiting 15:20:14 (5412): No heartbeat from core client for 30 sec - exiting 15:20:15 (5412): No heartbeat from core client for 30 sec - exiting 15:20:16 (5412): No heartbeat from core client for 30 sec - exiting 15:20:17 (5412): No heartbeat from core client for 30 sec - exiting 15:20:18 (5412): No heartbeat from core client for 30 sec - exiting Global Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5860, iMonCtr=2 Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5948, iMonCtr=2 Model crash detected, will try to restart... Leaving CPDN_Main::Monitor... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=5164, selfPID=5472, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=8072, selfPID=1624, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=2644, selfPID=4328, iMonCtr=1 Model crash detected, will try to restart... Leaving CPDN_Main::Monitor... Global Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5852, iMonCtr=2 CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=7484, selfPID=2992, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=4208, selfPID=5100, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Regional Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=6848, selfPID=6848, iMonCtr=2 Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=4664, selfPID=5080, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=6480, selfPID=5708, iMonCtr=1 Model crash detected, will try to restart... GController:: CPDN process is not running, exiting, bRetVal = 1, checkPID=784, selfPID=4708, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=6956, selfPID=6920, iMonCtr=1 Model crash detected, will try to restart... Leaving CPDN_Main::Monitor... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=4060, selfPID=5556, iMonCtr=1 Model crash detected, will try to restart... Leaving CPDN_Main::Monitor... Global Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4588, iMonCtr=2 Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=4296, selfPID=3532, iMonCtr=1 Model crash detected, will try to restart... Leaving CPDN_Main::Monitor... 00:00:41 (5784): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Leaving CPDN_Main::Monitor... 16:55:27 (1516): called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
27 Mar 2011 23:13:58	1062020	12229265	hadam3p_saf_1g3j_1990_1_006948695_0	138,336	486,810	3.5190
26 Mar 2011 02:05:01	1062020	12229265	hadam3p_saf_1g3j_1990_1_006948695_0	126,816	445,374	3.5120
24 Mar 2011 03:36:38	1062020	12229265	hadam3p_saf_1g3j_1990_1_006948695_0	115,296	405,070	3.5133
23 Mar 2011 03:09:55	1062020	12229265	hadam3p_saf_1g3j_1990_1_006948695_0	103,776	365,745	3.5244
20 Mar 2011 19:51:03	1062020	12229265	hadam3p_saf_1g3j_1990_1_006948695_0	92,256	326,849	3.5428
19 Mar 2011 18:13:12	1062020	12229265	hadam3p_saf_1g3j_1990_1_006948695_0	80,752	286,383	3.5465
19 Mar 2011 05:39:53	1062020	12229265	hadam3p_saf_1g3j_1990_1_006948695_0	80,736	285,764	3.5395
17 Mar 2011 22:08:56	1062020	12229265	hadam3p_saf_1g3j_1990_1_006948695_0	69,216	245,644	3.5489
16 Mar 2011 18:31:18	1062020	12229265	hadam3p_saf_1g3j_1990_1_006948695_0	57,696	203,751	3.5315
14 Mar 2011 23:02:37	1062020	12229265	hadam3p_saf_1g3j_1990_1_006948695_0	46,176	163,862	3.5486
13 Mar 2011 06:20:50	1062020	12229265	hadam3p_saf_1g3j_1990_1_006948695_0	34,656	123,575	3.5658
12 Mar 2011 04:14:19	1062020	12229265	hadam3p_saf_1g3j_1990_1_006948695_0	23,136	82,696	3.5743
10 Mar 2011 00:28:57	1062020	12229265	hadam3p_saf_1g3j_1990_1_006948695_0	11,616	41,379	3.5622