Task 15476732

Name	hadcm3n_zl98_1920_40_008255803_0
Workunit	8410927
Created	14 Dec 2012, 3:45:18 UTC
Sent	14 Dec 2012, 3:45:39 UTC
Report deadline	15 Mar 2013, 11:12:50 UTC
Received	2 Jan 2013, 2:56:13 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1257736
Run time	7 days 22 hours 40 min 36 sec
CPU time	7 days 20 hours 0 min 58 sec
Validate state	Invalid
Credit	6,842.88
Device peak FLOPS	4.31 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 18:05:18 (3432): No heartbeat from core client for 30 sec - exiting 18:05:19 (3432): No heartbeat from core client for 30 sec - exiting 18:05:20 (3432): No heartbeat from core client for 30 sec - exiting 18:05:21 (3432): No heartbeat from core client for 30 sec - exiting 18:05:22 (3432): No heartbeat from core client for 30 sec - exiting 18:05:23 (3432): No heartbeat from core client for 30 sec - exiting 18:05:24 (3432): No heartbeat from core client for 30 sec - exiting 18:05:25 (3432): No heartbeat from core client for 30 sec - exiting 18:05:26 (3432): No heartbeat from core client for 30 sec - exiting 18:05:27 (3432): No heartbeat from core client for 30 sec - exiting 18:05:28 (3432): No heartbeat from core client for 30 sec - exiting 18:05:29 (3432): No heartbeat from core client for 30 sec - exiting 18:05:30 (3432): No heartbeat from core client for 30 sec - exiting 18:05:31 (3432): No heartbeat from core client for 30 sec - exiting 18:05:32 (3432): No heartbeat from core client for 30 sec - exiting 18:05:33 (3432): No heartbeat from core client for 30 sec - exiting 18:05:34 (3432): No heartbeat from core client for 30 sec - exiting 18:05:35 (3432): No heartbeat from core client for 30 sec - exiting 18:05:36 (3432): No heartbeat from core client for 30 sec - exiting 18:05:37 (3432): No heartbeat from core client for 30 sec - exiting 18:05:38 (3432): No heartbeat from core client for 30 sec - exiting 18:05:39 (3432): No heartbeat from core client for 30 sec - exiting 18:05:40 (3432): No heartbeat from core client for 30 sec - exiting 18:05:41 (3432): No heartbeat from core client for 30 sec - exiting 18:05:42 (3432): No heartbeat from core client for 30 sec - exiting 18:05:43 (3432): No heartbeat from core client for 30 sec - exiting 18:05:44 (3432): No heartbeat from core client for 30 sec - exiting 18:05:45 (3432): No heartbeat from core client for 30 sec - exiting 18:05:46 (3432): No heartbeat from core client for 30 sec - exiting 18:05:47 (3432): No heartbeat from core client for 30 sec - exiting 18:05:48 (3432): No heartbeat from core client for 30 sec - exiting 18:05:49 (3432): No heartbeat from core client for 30 sec - exiting 18:05:50 (3432): No heartbeat from core client for 30 sec - exiting 18:05:51 (3432): No heartbeat from core client for 30 sec - exiting 18:05:52 (3432): No heartbeat from core client for 30 sec - exiting 18:05:53 (3432): No heartbeat from core client for 30 sec - exiting 18:05:54 (3432): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3644, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5348, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5348, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5348, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5348, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5348, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
24 Dec 2012 19:37:26	1257736	15476732	hadcm3n_zl98_1920_40_008255803_0	570,240	665,561	1.1672
24 Dec 2012 10:38:19	1257736	15476732	hadcm3n_zl98_1920_40_008255803_0	544,320	634,059	1.1649
24 Dec 2012 01:49:41	1257736	15476732	hadcm3n_zl98_1920_40_008255803_0	518,400	602,675	1.1626
23 Dec 2012 16:59:59	1257736	15476732	hadcm3n_zl98_1920_40_008255803_0	492,480	571,428	1.1603
23 Dec 2012 08:12:53	1257736	15476732	hadcm3n_zl98_1920_40_008255803_0	466,560	539,990	1.1574
22 Dec 2012 16:25:55	1257736	15476732	hadcm3n_zl98_1920_40_008255803_0	440,640	508,705	1.1545
22 Dec 2012 07:54:15	1257736	15476732	hadcm3n_zl98_1920_40_008255803_0	414,720	477,636	1.1517
21 Dec 2012 02:53:50	1257736	15476732	hadcm3n_zl98_1920_40_008255803_0	388,800	446,296	1.1479
20 Dec 2012 17:58:31	1257736	15476732	hadcm3n_zl98_1920_40_008255803_0	362,880	414,949	1.1435
20 Dec 2012 09:06:53	1257736	15476732	hadcm3n_zl98_1920_40_008255803_0	336,960	383,566	1.1383
20 Dec 2012 00:19:25	1257736	15476732	hadcm3n_zl98_1920_40_008255803_0	311,040	352,256	1.1325
19 Dec 2012 15:33:08	1257736	15476732	hadcm3n_zl98_1920_40_008255803_0	285,120	321,003	1.1259
19 Dec 2012 06:56:36	1257736	15476732	hadcm3n_zl98_1920_40_008255803_0	259,200	289,720	1.1177
18 Dec 2012 22:14:38	1257736	15476732	hadcm3n_zl98_1920_40_008255803_0	233,280	258,488	1.1081
18 Dec 2012 13:30:21	1257736	15476732	hadcm3n_zl98_1920_40_008255803_0	207,360	227,511	1.0972
18 Dec 2012 04:45:59	1257736	15476732	hadcm3n_zl98_1920_40_008255803_0	181,440	196,592	1.0835
16 Dec 2012 18:32:49	1257736	15476732	hadcm3n_zl98_1920_40_008255803_0	155,520	166,412	1.0700
16 Dec 2012 10:29:54	1257736	15476732	hadcm3n_zl98_1920_40_008255803_0	129,600	138,101	1.0656
15 Dec 2012 15:50:52	1257736	15476732	hadcm3n_zl98_1920_40_008255803_0	103,680	109,889	1.0599
15 Dec 2012 08:28:31	1257736	15476732	hadcm3n_zl98_1920_40_008255803_0	77,760	81,555	1.0488