Task 12732981

Name	hadcm3n_o0fv_1900_40_007195902_1
Workunit	7394182
Created	28 Mar 2011, 13:56:58 UTC
Sent	3 Apr 2011, 2:20:29 UTC
Report deadline	3 Jul 2011, 9:47:40 UTC
Received	17 May 2011, 22:27:15 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	615938
Run time	12 days 16 hours 34 min 11 sec
CPU time	12 days 3 hours 30 min 37 sec
Validate state	Invalid
Credit	5,909.76
Device peak FLOPS	2.45 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 i686-apple-darwin
Stderr	<core_client_version>6.12.26</core_client_version> <![CDATA[ <message> process exited with code 22 (0x16, -234) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 12:27:26 (35713): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 12:27:27 (35713): No heartbeat from core client for 30 sec - exiting 12:27:28 (35713): No heartbeat from core client for 30 sec - exiting 12:27:29 (35713): No heartbeat from core client for 30 sec - exiting 12:27:30 (35713): No heartbeat from core client for 30 sec - exiting 12:27:31 (35713): No heartbeat from core client for 30 sec - exiting 12:27:32 (35713): No heartbeat from core client for 30 sec - exiting 12:27:33 (35713): No heartbeat from core client for 30 sec - exiting 12:27:34 (35713): No heartbeat from core client for 30 sec - exiting 12:27:35 (35713): No heartbeat from core client for 30 sec - exiting 12:27:36 (35713): No heartbeat from core client for 30 sec - exiting 12:27:37 (35713): No heartbeat from core client for 30 sec - exiting 12:27:38 (35713): No heartbeat from core client for 30 sec - exiting 12:27:39 (35713): No heartbeat from core client for 30 sec - exiting 12:27:40 (35713): No heartbeat from core client for 30 sec - exiting 12:27:41 (35713): No heartbeat from core client for 30 sec - exiting 12:27:42 (35713): No heartbeat from core client for 30 sec - exiting 12:27:43 (35713): No heartbeat from core client for 30 sec - exiting 12:27:44 (35713): No heartbeat from core client for 30 sec - exiting 12:27:45 (35713): No heartbeat from core client for 30 sec - exiting 12:27:46 (35713): No heartbeat from core client for 30 sec - exiting 12:27:47 (35713): No heartbeat from core client for 30 sec - exiting 12:27:48 (35713): No heartbeat from core client for 30 sec - exiting 12:27:49 (35713): No heartbeat from core client for 30 sec - exiting 12:27:50 (35713): No heartbeat from core client for 30 sec - exiting 12:27:51 (35713): No heartbeat from core client for 30 sec - exiting 12:27:52 (35713): No heartbeat from core client for 30 sec - exiting 12:27:53 (35713): No heartbeat from core client for 30 sec - exiting 12:27:54 (35713): No heartbeat from core client for 30 sec - exiting 12:27:55 (35713): No heartbeat from core client for 30 sec - exiting 12:27:56 (35713): No heartbeat from core client for 30 sec - exiting 12:27:57 (35713): No heartbeat from core client for 30 sec - exiting 12:27:58 (35713): No heartbeat from core client for 30 sec - exiting 12:27:59 (35713): No heartbeat from core client for 30 sec - exiting 12:28:00 (35713): No heartbeat from core client for 30 sec - exiting 12:28:01 (35713): No heartbeat from core client for 30 sec - exiting 12:28:02 (35713): No heartbeat from core client for 30 sec - exiting 12:28:03 (35713): No heartbeat from core client for 30 sec - exiting 12:28:04 (35713): No heartbeat from core client for 30 sec - exiting 12:28:05 (35713): No heartbeat from core client for 30 sec - exiting 12:28:06 (35713): No heartbeat from core client for 30 sec - exiting 12:28:07 (35713): No heartbeat from core client for 30 sec - exiting 12:28:08 (35713): No heartbeat from core client for 30 sec - exiting 12:28:09 (35713): No heartbeat from core client for 30 sec - exiting 12:28:10 (35713): No heartbeat from core client for 30 sec - exiting 12:47:43 (39317): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 12:54:51 (247): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 19:14:45 (222): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 17:56:24 (230): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 16:00:27 (231): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 16:07:04 (224): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 12:23:39 (4567): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 12:30:00 (247): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... execl(/Volumes/Totoro/BOINC Data/projects/climateprediction.net/hadcm3n_um_6.07_i686-apple-darwin, 136575) failed! Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5676, iMonCtr=1 Model crash detected, will try to restart... execl(/Volumes/Totoro/BOINC Data/projects/climateprediction.net/hadcm3n_um_6.07_i686-apple-darwin, 136575) failed! Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5676, iMonCtr=1 Model crash detected, will try to restart... execl(/Volumes/Totoro/BOINC Data/projects/climateprediction.net/hadcm3n_um_6.07_i686-apple-darwin, 136575) failed! Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5676, iMonCtr=1 Model crash detected, will try to restart... execl(/Volumes/Totoro/BOINC Data/projects/climateprediction.net/hadcm3n_um_6.07_i686-apple-darwin, 136575) failed! Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5676, iMonCtr=1 Model crash detected, will try to restart... execl(/Volumes/Totoro/BOINC Data/projects/climateprediction.net/hadcm3n_um_6.07_i686-apple-darwin, 136575) failed! Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5676, iMonCtr=1 Model crash detected, will try to restart... execl(/Volumes/Totoro/BOINC Data/projects/climateprediction.net/hadcm3n_um_6.07_i686-apple-darwin, 136575) failed! Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5676, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
17 May 2011 11:06:05	615938	12732981	hadcm3n_o0fv_1900_40_007195902_1	492,480	1,012,779	2.0565
16 May 2011 18:26:17	615938	12732981	hadcm3n_o0fv_1900_40_007195902_1	466,560	959,448	2.0564
16 May 2011 02:59:15	615938	12732981	hadcm3n_o0fv_1900_40_007195902_1	440,640	905,969	2.0560
15 May 2011 07:16:14	615938	12732981	hadcm3n_o0fv_1900_40_007195902_1	414,720	852,675	2.0560
14 May 2011 11:01:34	615938	12732981	hadcm3n_o0fv_1900_40_007195902_1	388,800	799,261	2.0557
13 May 2011 13:11:38	615938	12732981	hadcm3n_o0fv_1900_40_007195902_1	362,880	745,870	2.0554
12 May 2011 19:32:08	615938	12732981	hadcm3n_o0fv_1900_40_007195902_1	336,960	692,521	2.0552
12 May 2011 04:04:02	615938	12732981	hadcm3n_o0fv_1900_40_007195902_1	311,040	638,979	2.0543
11 May 2011 12:27:54	615938	12732981	hadcm3n_o0fv_1900_40_007195902_1	285,120	585,498	2.0535
10 May 2011 20:40:34	615938	12732981	hadcm3n_o0fv_1900_40_007195902_1	259,200	532,047	2.0527
10 May 2011 03:07:25	615938	12732981	hadcm3n_o0fv_1900_40_007195902_1	233,280	478,439	2.0509
08 May 2011 23:29:18	615938	12732981	hadcm3n_o0fv_1900_40_007195902_1	207,360	425,163	2.0504
07 May 2011 14:36:37	615938	12732981	hadcm3n_o0fv_1900_40_007195902_1	181,440	372,037	2.0505
06 May 2011 23:15:03	615938	12732981	hadcm3n_o0fv_1900_40_007195902_1	155,520	318,995	2.0512
06 May 2011 08:03:55	615938	12732981	hadcm3n_o0fv_1900_40_007195902_1	129,600	266,417	2.0557
05 May 2011 17:15:37	615938	12732981	hadcm3n_o0fv_1900_40_007195902_1	103,680	213,715	2.0613
05 May 2011 01:22:55	615938	12732981	hadcm3n_o0fv_1900_40_007195902_1	77,760	160,568	2.0649
04 May 2011 09:52:47	615938	12732981	hadcm3n_o0fv_1900_40_007195902_1	51,840	107,052	2.0650
03 May 2011 15:32:41	615938	12732981	hadcm3n_o0fv_1900_40_007195902_1	25,920	53,502	2.0641