Task 15003948

Name	hadam3p_pnw_bu1w_1988_1_008091416_0
Workunit	8246530
Created	26 Jul 2012, 14:53:52 UTC
Sent	26 Jul 2012, 14:58:10 UTC
Report deadline	8 Jul 2013, 20:18:10 UTC
Received	19 Sep 2012, 10:27:56 UTC
Server state	Over
Outcome	Success
Client state	Done
Exit status	0 (0x00000000)
Computer ID	1229383
Run time	6 days 9 hours 57 min 45 sec
CPU time	4 days 19 hours 34 min 44 sec
Validate state	Workunit error - check skipped
Credit	3,003.83
Device peak FLOPS	2.59 GFLOPS
Application version	UK Met Office HadAM3P-HadRM3P Pacific North West v6.09 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <stderr_txt> Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5760, iMonCtr=2 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... 19:32:33 (3308): No heartbeat from core client for 30 sec - exiting 19:32:34 (3308): No heartbeat from core client for 30 sec - exiting 19:32:35 (3308): No heartbeat from core client for 30 sec - exiting 19:32:36 (3308): No heartbeat from core client for 30 sec - exiting 19:32:37 (3308): No heartbeat from core client for 30 sec - exiting 19:32:38 (3308): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Global Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3800, iMonCtr=2 Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3180, iMonCtr=2 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... GGlobal Worker:: CPDN process is not running, exiting, bRetGlobal Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2488, iMonCtr=2 Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=2564, selfPID=3128, iMonCtr=1 Model crash detected, will try to restart... 11:36:35 (3324): No heartbeat from core client for 30 sec - exiting 11:36:36 (3324): No heartbeat from core client for 30 sec - exiting 11:36:37 (3324): No heartbeat from core client for 30 sec - exiting 11:36:38 (3324): No heartbeat from core client for 30 sec - exiting 11:36:39 (3324): No heartbeat from core client for 30 sec - exiting 11:36:40 (3324): No heartbeat from core client for 30 sec - exiting 11:36:42 (3324): No heartbeat from core client for 30 sec - exiting 11:36:43 (3324): No heartbeat from core client for 30 sec - exiting 11:36:44 (3324): No heartbeat from core client for 30 sec - exiting 11:36:45 (3324): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 10:50:37 (3384): No heartbeat from core client for 30 sec - exiting 10:50:40 (3384): No heartbeat from core client for 30 sec - exiting 10:50:41 (3384): No heartbeat from core client for 30 sec - exiting 10:50:42 (3384): No heartbeat from core client for 30 sec - exiting 10:50:44 (3384): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Regional Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=4512, selfPID=4512, iMonCtr=2 CPDN Monitor - Quit request from BOINC... Global Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4008, iMonCtr=2 Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1712, iMonCtr=2 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3388, iMonCtr=2 Model crash detected, will try to restart... C17:30:13 (3104): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... GController:: CPDN process is not running, exiting, bRetVal = 1, checkPID=4152, selfPID=2540, iMonCtr=1 Model crash detected, will try to restart... Leaving CPDN_Main::Monitor... Regional yearly means requires 12 input files got 6 CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=3644, selfPID=1252, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Regional Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=3728, selfPID=3728, iMonCtr=2 08:03:46 (796): No heartbeat from core client for 30 sec - exiting 08:03:50 (796): No heartbeat from core client for 30 sec - exiting 08:03:51 (796): No heartbeat from core client for 30 sec - exiting 08:03:53 (796): No heartbeat from core client for 30 sec - exiting 08:03:54 (796): No heartbeat from core client for 30 sec - exiting 08:03:55 (796): No heartbeat from core client for 30 sec - exiting 08:03:56 (796): No heartbeat from core client for 30 sec - exiting 08:03:57 (796): No heartbeat from core client for 30 sec - exiting 08:03:58 (796): No heartbeat from core client for 30 sec - exiting 08:03:59 (796): No heartbeat from core client for 30 sec - exiting 08:04:00 (796): No heartbeat from core client for 30 sec - exiting 08:04:01 (796): No heartbeat from core client for 30 sec - exiting 08:04:02 (796): No heartbeat from core client for 30 sec - exiting 08:04:03 (796): No heartbeat from core client for 30 sec - exiting 08:04:04 (796): No heartbeat from core client for 30 sec - exiting 08:04:05 (796): No heartbeat from core client for 30 sec - exiting 08:06:15 (2976): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=2852, selfPID=3124, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Regional Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=3652, selfPID=3652, iMonCtr=2 Global Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3344, iMonCtr=2 Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=3388, selfPID=3328, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=3856, selfPID=3124, iMonCtr=1 Model crash detected, will try to restart... zip error: Could not create output file (was replacing the original zip file) CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Regional Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=3004, selfPID=3004, iMonCtr=2 CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4464, iMonCtr=2 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3380, iMonCtr=2 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CCPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3288, iMonCtr=2 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 12:38:50 (3460): No heartbeat from core client for 30 sec - exiting 12:38:51 (3460): No heartbeat from core client for 30 sec - exiting 12:38:52 (3460): No heartbeat from core client for 30 sec - exiting 12:38:53 (3460): No heartbeat from core client for 30 sec - exiting 12:38:54 (3460): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Regional Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=148, selfPID=148, iMonCtr=2 CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Global Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3384, iMonCtr=2 Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=3420, selfPID=3304, iMonCtr=1 Model crash detected, will try to restart... Leaving CPDN_Main::Monitor... Leaving CPDN_Main::Monitor... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
19 Sep 2012 09:28:18	1229383	15003948	hadam3p_pnw_bu1w_1988_1_008091416_0	138,242	414,949	3.0016
16 Sep 2012 19:39:48	1229383	15003948	hadam3p_pnw_bu1w_1988_1_008091416_0	138,240	414,511	2.9985
09 Sep 2012 10:10:22	1229383	15003948	hadam3p_pnw_bu1w_1988_1_008091416_0	126,720	380,571	3.0032
05 Sep 2012 13:01:30	1229383	15003948	hadam3p_pnw_bu1w_1988_1_008091416_0	115,200	345,143	2.9960
02 Sep 2012 15:17:06	1229383	15003948	hadam3p_pnw_bu1w_1988_1_008091416_0	103,682	310,613	2.9958
02 Sep 2012 08:20:37	1229383	15003948	hadam3p_pnw_bu1w_1988_1_008091416_0	103,680	310,224	2.9921
29 Aug 2012 10:35:47	1229383	15003948	hadam3p_pnw_bu1w_1988_1_008091416_0	92,256	276,469	2.9968
26 Aug 2012 08:15:10	1229383	15003948	hadam3p_pnw_bu1w_1988_1_008091416_0	80,736	242,492	3.0035
16 Aug 2012 22:27:35	1229383	15003948	hadam3p_pnw_bu1w_1988_1_008091416_0	69,216	207,937	3.0042
13 Aug 2012 11:14:52	1229383	15003948	hadam3p_pnw_bu1w_1988_1_008091416_0	57,697	174,039	3.0164
13 Aug 2012 10:14:40	1229383	15003948	hadam3p_pnw_bu1w_1988_1_008091416_0	57,696	173,638	3.0095
10 Aug 2012 18:35:49	1229383	15003948	hadam3p_pnw_bu1w_1988_1_008091416_0	46,176	138,934	3.0088
06 Aug 2012 14:29:40	1229383	15003948	hadam3p_pnw_bu1w_1988_1_008091416_0	34,656	104,777	3.0233
03 Aug 2012 07:51:18	1229383	15003948	hadam3p_pnw_bu1w_1988_1_008091416_0	23,136	69,495	3.0038
31 Jul 2012 06:27:04	1229383	15003948	hadam3p_pnw_bu1w_1988_1_008091416_0	11,616	34,617	2.9801