Task 15464727

Name	hadcm3n_zgfk_1880_40_008250556_2
Workunit	8405680
Created	27 Nov 2012, 23:33:49 UTC
Sent	27 Nov 2012, 23:33:59 UTC
Report deadline	27 Feb 2013, 7:01:10 UTC
Received	14 Dec 2012, 12:32:44 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1240130
Run time	8 days 18 hours 48 min 15 sec
CPU time	5 days 16 hours 32 min 24 sec
Validate state	Invalid
Credit	6,531.84
Device peak FLOPS	4.07 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.58</core_client_version> <![CDATA[ <message> ????????? (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 03:33:51 (2304): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 20:09:01 (46140): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 20:14:41 (54376): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 00:03:26 (54400): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 00:04:58 (57280): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 00:14:45 (81504): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 00:59:05 (80972): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 21:31:20 (92224): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 22:14:23 (37268): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=9004, iMonCtr=1 Model crash detected, will try to restart... 22:49:18 (6880): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7732, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7732, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7732, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7732, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=8292, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=8292, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
14 Dec 2012 12:35:31	1240130	15464727	hadcm3n_zgfk_1880_40_008250556_2	544,320	485,506	0.8919
14 Dec 2012 12:35:31	1240130	15464727	hadcm3n_zgfk_1880_40_008250556_2	518,400	461,188	0.8896
14 Dec 2012 12:35:31	1240130	15464727	hadcm3n_zgfk_1880_40_008250556_2	492,480	440,263	0.8940
14 Dec 2012 12:35:31	1240130	15464727	hadcm3n_zgfk_1880_40_008250556_2	466,560	417,966	0.8958
05 Dec 2012 11:45:04	1240130	15464727	hadcm3n_zgfk_1880_40_008250556_2	440,640	394,578	0.8955
05 Dec 2012 02:43:12	1240130	15464727	hadcm3n_zgfk_1880_40_008250556_2	414,720	371,106	0.8948
04 Dec 2012 18:37:02	1240130	15464727	hadcm3n_zgfk_1880_40_008250556_2	388,800	347,635	0.8941
04 Dec 2012 05:46:33	1240130	15464727	hadcm3n_zgfk_1880_40_008250556_2	362,880	324,669	0.8947
03 Dec 2012 19:10:54	1240130	15464727	hadcm3n_zgfk_1880_40_008250556_2	336,960	301,981	0.8962
03 Dec 2012 05:28:42	1240130	15464727	hadcm3n_zgfk_1880_40_008250556_2	311,040	279,455	0.8985
02 Dec 2012 18:30:11	1240130	15464727	hadcm3n_zgfk_1880_40_008250556_2	285,120	256,969	0.9013
02 Dec 2012 08:33:35	1240130	15464727	hadcm3n_zgfk_1880_40_008250556_2	259,200	234,253	0.9038
01 Dec 2012 19:24:17	1240130	15464727	hadcm3n_zgfk_1880_40_008250556_2	233,280	211,739	0.9077
01 Dec 2012 08:11:08	1240130	15464727	hadcm3n_zgfk_1880_40_008250556_2	207,360	189,210	0.9125
30 Nov 2012 22:38:58	1240130	15464727	hadcm3n_zgfk_1880_40_008250556_2	181,440	167,109	0.9210
30 Nov 2012 12:23:28	1240130	15464727	hadcm3n_zgfk_1880_40_008250556_2	155,520	143,503	0.9227
30 Nov 2012 02:10:25	1240130	15464727	hadcm3n_zgfk_1880_40_008250556_2	129,600	120,517	0.9299
29 Nov 2012 15:28:32	1240130	15464727	hadcm3n_zgfk_1880_40_008250556_2	103,680	97,197	0.9375
29 Nov 2012 05:21:49	1240130	15464727	hadcm3n_zgfk_1880_40_008250556_2	77,760	72,713	0.9351
28 Nov 2012 19:52:56	1240130	15464727	hadcm3n_zgfk_1880_40_008250556_2	51,840	48,421	0.9340