Task 15821116

Name	hadcm3n_39uu_2020_40_008363567_1
Workunit	8514426
Created	3 Jun 2013, 4:11:33 UTC
Sent	3 Jun 2013, 5:04:24 UTC
Report deadline	2 Sep 2013, 12:31:35 UTC
Received	25 Jun 2013, 3:46:33 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1285396
Run time	20 days 21 hours 51 min 29 sec
CPU time	20 days 17 hours 27 min 24 sec
Validate state	Invalid
Credit	5,287.68
Device peak FLOPS	1.54 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.64</core_client_version> <![CDATA[ <message> Устройство не опознает команду. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 18:22:19 (7680): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 18:22:20 (7680): No heartbeat from core client for 30 sec - exiting 18:22:21 (7680): No heartbeat from core client for 30 sec - exiting 18:22:22 (7680): No heartbeat from core client for 30 sec - exiting 18:22:23 (7680): No heartbeat from core client for 30 sec - exiting 18:22:24 (7680): No heartbeat from core client for 30 sec - exiting 18:22:25 (7680): No heartbeat from core client for 30 sec - exiting 18:22:26 (7680): No heartbeat from core client for 30 sec - exiting 18:22:27 (7680): No heartbeat from core client for 30 sec - exiting 18:22:28 (7680): No heartbeat from core client for 30 sec - exiting 18:22:29 (7680): No heartbeat from core client for 30 sec - exiting 21:12:10 (7256): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 21:12:11 (7256): No heartbeat from core client for 30 sec - exiting 21:12:12 (7256): No heartbeat from core client for 30 sec - exiting 21:12:13 (7256): No heartbeat from core client for 30 sec - exiting 21:12:14 (7256): No heartbeat from core client for 30 sec - exiting 21:12:15 (7256): No heartbeat from core client for 30 sec - exiting 21:12:16 (7256): No heartbeat from core client for 30 sec - exiting 21:12:17 (7256): No heartbeat from core client for 30 sec - exiting 21:12:18 (7256): No heartbeat from core client for 30 sec - exiting 21:12:19 (7256): No heartbeat from core client for 30 sec - exiting 21:12:20 (7256): No heartbeat from core client for 30 sec - exiting Atmos Hold Restart file rename failed on atmos_restart.hold 21:18:29 (7588): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 21:18:30 (7588): No heartbeat from core client for 30 sec - exiting 21:18:31 (7588): No heartbeat from core client for 30 sec - exiting 21:18:32 (7588): No heartbeat from core client for 30 sec - exiting 21:18:33 (7588): No heartbeat from core client for 30 sec - exiting 21:18:34 (7588): No heartbeat from core client for 30 sec - exiting 21:18:35 (7588): No heartbeat from core client for 30 sec - exiting 21:18:36 (7588): No heartbeat from core client for 30 sec - exiting 21:18:37 (7588): No heartbeat from core client for 30 sec - exiting 21:18:38 (7588): No heartbeat from core client for 30 sec - exiting 21:18:39 (7588): No heartbeat from core client for 30 sec - exiting 21:20:04 (7348): No heartbeat from core client for 30 sec - exiting 21:20:05 (7348): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1872, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1872, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1872, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1872, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1872, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1872, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
24 Jun 2013 15:43:00	1273949	15821116	hadcm3n_39uu_2020_40_008363567_1	440,640	1,784,910	4.0507
24 Jun 2013 08:49:54	1273949	15821116	hadcm3n_39uu_2020_40_008363567_1	414,720	1,760,705	4.2455
24 Jun 2013 02:06:55	1273949	15821116	hadcm3n_39uu_2020_40_008363567_1	388,800	1,736,622	4.4666
23 Jun 2013 19:25:58	1273949	15821116	hadcm3n_39uu_2020_40_008363567_1	362,880	1,712,586	4.7194
23 Jun 2013 12:23:14	1273949	15821116	hadcm3n_39uu_2020_40_008363567_1	336,960	1,688,206	5.0101
23 Jun 2013 05:10:19	1273949	15821116	hadcm3n_39uu_2020_40_008363567_1	311,040	1,662,534	5.3451
22 Jun 2013 22:12:02	1273949	15821116	hadcm3n_39uu_2020_40_008363567_1	285,120	1,637,597	5.7435
22 Jun 2013 15:09:02	1273949	15821116	hadcm3n_39uu_2020_40_008363567_1	259,200	1,612,583	6.2214
21 Jun 2013 07:27:48	1273949	15821116	hadcm3n_39uu_2020_40_008363567_1	233,280	1,510,013	6.4730
19 Jun 2013 08:31:15	1273949	15821116	hadcm3n_39uu_2020_40_008363567_1	207,360	1,342,551	6.4745
17 Jun 2013 09:31:13	1273949	15821116	hadcm3n_39uu_2020_40_008363567_1	181,440	1,174,809	6.4749
15 Jun 2013 10:10:11	1273949	15821116	hadcm3n_39uu_2020_40_008363567_1	155,520	1,005,833	6.4675
13 Jun 2013 10:54:36	1273949	15821116	hadcm3n_39uu_2020_40_008363567_1	129,600	837,437	6.4617
11 Jun 2013 11:39:29	1273949	15821116	hadcm3n_39uu_2020_40_008363567_1	103,680	668,617	6.4489
09 Jun 2013 12:26:06	1273949	15821116	hadcm3n_39uu_2020_40_008363567_1	77,760	500,113	6.4315
07 Jun 2013 13:27:27	1273949	15821116	hadcm3n_39uu_2020_40_008363567_1	51,840	332,148	6.4072
05 Jun 2013 14:12:45	1273949	15821116	hadcm3n_39uu_2020_40_008363567_1	25,920	163,786	6.3189