Task 13139471

Name	hadcm3n_ykry_1900_40_007359784_2
Workunit	7557214
Created	15 Jul 2011, 16:24:28 UTC
Sent	15 Jul 2011, 16:29:03 UTC
Report deadline	14 Oct 2011, 23:56:14 UTC
Received	6 Aug 2011, 20:53:09 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1147560
Run time	9 days 2 hours 58 min 6 sec
CPU time	8 days 16 hours 46 min 26 sec
Validate state	Invalid
Credit	10,575.36
Device peak FLOPS	4.19 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 i686-apple-darwin
Stderr	<core_client_version>6.12.33</core_client_version> <![CDATA[ <message> process exited with code 22 (0x16, -234) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 08:52:54 (2889): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 00:02:43 (7437): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... execl(/Library/Application Support/BOINC Data/projects/climateprediction.net/hadcm3n_um_6.07_i686-apple-darwin, 141795) failed! Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=730, iMonCtr=1 Model crash detected, will try to restart... execl(/Library/Application Support/BOINC Data/projects/climateprediction.net/hadcm3n_um_6.07_i686-apple-darwin, 141795) failed! Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=730, iMonCtr=1 Model crash detected, will try to restart... execl(/Library/Application Support/BOINC Data/projects/climateprediction.net/hadcm3n_um_6.07_i686-apple-darwin, 141795) failed! Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=730, iMonCtr=1 Model crash detected, will try to restart... execl(/Library/Application Support/BOINC Data/projects/climateprediction.net/hadcm3n_um_6.07_i686-apple-darwin, 141795) failed! Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=730, iMonCtr=1 Model crash detected, will try to restart... execl(/Library/Application Support/BOINC Data/projects/climateprediction.net/hadcm3n_um_6.07_i686-apple-darwin, 141795) failed! Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=730, iMonCtr=1 Model crash detected, will try to restart... execl(/Library/Application Support/BOINC Data/projects/climateprediction.net/hadcm3n_um_6.07_i686-apple-darwin, 141795) failed! Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=730, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
06 Aug 2011 14:20:47	1147560	13139471	hadcm3n_ykry_1900_40_007359784_2	881,280	734,630	0.8336
06 Aug 2011 06:41:14	1147560	13139471	hadcm3n_ykry_1900_40_007359784_2	855,360	713,366	0.8340
05 Aug 2011 20:06:18	1147560	13139471	hadcm3n_ykry_1900_40_007359784_2	829,440	690,761	0.8328
04 Aug 2011 19:40:27	1147560	13139471	hadcm3n_ykry_1900_40_007359784_2	803,520	668,441	0.8319
04 Aug 2011 12:45:30	1147560	13139471	hadcm3n_ykry_1900_40_007359784_2	777,600	644,935	0.8294
04 Aug 2011 00:51:00	1147560	13139471	hadcm3n_ykry_1900_40_007359784_2	751,680	622,573	0.8282
03 Aug 2011 17:58:16	1147560	13139471	hadcm3n_ykry_1900_40_007359784_2	725,760	600,630	0.8276
03 Aug 2011 06:08:14	1147560	13139471	hadcm3n_ykry_1900_40_007359784_2	699,840	578,743	0.8270
02 Aug 2011 23:23:34	1147560	13139471	hadcm3n_ykry_1900_40_007359784_2	673,920	557,088	0.8266
02 Aug 2011 15:19:29	1147560	13139471	hadcm3n_ykry_1900_40_007359784_2	648,000	535,146	0.8258
02 Aug 2011 08:31:45	1147560	13139471	hadcm3n_ykry_1900_40_007359784_2	622,080	514,131	0.8265
01 Aug 2011 22:49:31	1147560	13139471	hadcm3n_ykry_1900_40_007359784_2	596,160	492,960	0.8269
01 Aug 2011 15:12:26	1147560	13139471	hadcm3n_ykry_1900_40_007359784_2	570,240	471,797	0.8274
01 Aug 2011 09:08:14	1147560	13139471	hadcm3n_ykry_1900_40_007359784_2	544,320	450,539	0.8277
01 Aug 2011 02:00:55	1147560	13139471	hadcm3n_ykry_1900_40_007359784_2	518,400	429,563	0.8286
31 Jul 2011 18:57:10	1147560	13139471	hadcm3n_ykry_1900_40_007359784_2	492,480	408,502	0.8295
31 Jul 2011 10:34:46	1147560	13139471	hadcm3n_ykry_1900_40_007359784_2	466,560	387,264	0.8300
30 Jul 2011 23:32:14	1147560	13139471	hadcm3n_ykry_1900_40_007359784_2	440,640	366,063	0.8308
30 Jul 2011 13:25:19	1147560	13139471	hadcm3n_ykry_1900_40_007359784_2	414,720	344,982	0.8318
30 Jul 2011 06:16:46	1147560	13139471	hadcm3n_ykry_1900_40_007359784_2	388,800	323,794	0.8328