Task 15623334

Name	hadcm3n_n50b_1880_40_008284802_1
Workunit	8435937
Created	22 Feb 2013, 20:14:37 UTC
Sent	22 Feb 2013, 20:14:54 UTC
Report deadline	25 May 2013, 3:42:05 UTC
Received	27 Feb 2013, 11:23:54 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1207421
Run time	4 days 9 hours 55 min 42 sec
CPU time	4 days 9 hours 43 min 26 sec
Validate state	Invalid
Credit	5,909.76
Device peak FLOPS	3.46 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 01:18:29 (3028): No heartbeat from core client for 30 sec - exiting 01:18:30 (3028): No heartbeat from core client for 30 sec - exiting 01:18:31 (3028): No heartbeat from core client for 30 sec - exiting 01:18:32 (3028): No heartbeat from core client for 30 sec - exiting 01:18:33 (3028): No heartbeat from core client for 30 sec - exiting 01:18:34 (3028): No heartbeat from core client for 30 sec - exiting 01:18:35 (3028): No heartbeat from core client for 30 sec - exiting 01:18:36 (3028): No heartbeat from core client for 30 sec - exiting 01:18:37 (3028): No heartbeat from core client for 30 sec - exiting 01:18:38 (3028): No heartbeat from core client for 30 sec - exiting 01:18:39 (3028): No heartbeat from core client for 30 sec - exiting 01:18:40 (3028): No heartbeat from core client for 30 sec - exiting 01:18:41 (3028): No heartbeat from core client for 30 sec - exiting 01:18:42 (3028): No heartbeat from core client for 30 sec - exiting 01:18:43 (3028): No heartbeat from core client for 30 sec - exiting 01:18:44 (3028): No heartbeat from core client for 30 sec - exiting 01:18:45 (3028): No heartbeat from core client for 30 sec - exiting 01:18:46 (3028): No heartbeat from core client for 30 sec - exiting 01:18:47 (3028): No heartbeat from core client for 30 sec - exiting 01:18:48 (3028): No heartbeat from core client for 30 sec - exiting 01:18:49 (3028): No heartbeat from core client for 30 sec - exiting 01:18:50 (3028): No heartbeat from core client for 30 sec - exiting 01:18:51 (3028): No heartbeat from core client for 30 sec - exiting 01:18:52 (3028): No heartbeat from core client for 30 sec - exiting 01:18:53 (3028): No heartbeat from core client for 30 sec - exiting 01:18:54 (3028): No heartbeat from core client for 30 sec - exiting 01:18:55 (3028): No heartbeat from core client for 30 sec - exiting 01:18:56 (3028): No heartbeat from core client for 30 sec - exiting 01:18:57 (3028): No heartbeat from core client for 30 sec - exiting 01:18:58 (3028): No heartbeat from core client for 30 sec - exiting 01:18:59 (3028): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 01:20:29 (2016): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5652, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5652, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5652, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5652, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5652, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5652, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
27 Feb 2013 05:41:07	1207421	15623334	hadcm3n_n50b_1880_40_008284802_1	492,480	377,693	0.7669
26 Feb 2013 23:54:40	1207421	15623334	hadcm3n_n50b_1880_40_008284802_1	466,560	358,011	0.7673
26 Feb 2013 18:06:49	1207421	15623334	hadcm3n_n50b_1880_40_008284802_1	440,640	337,114	0.7651
26 Feb 2013 12:21:23	1207421	15623334	hadcm3n_n50b_1880_40_008284802_1	414,720	316,390	0.7629
26 Feb 2013 06:39:39	1207421	15623334	hadcm3n_n50b_1880_40_008284802_1	388,800	296,007	0.7613
26 Feb 2013 00:52:35	1207421	15623334	hadcm3n_n50b_1880_40_008284802_1	362,880	275,029	0.7579
25 Feb 2013 19:18:04	1207421	15623334	hadcm3n_n50b_1880_40_008284802_1	336,960	254,312	0.7547
25 Feb 2013 13:16:19	1207421	15623334	hadcm3n_n50b_1880_40_008284802_1	311,040	233,771	0.7516
25 Feb 2013 07:44:24	1207421	15623334	hadcm3n_n50b_1880_40_008284802_1	285,120	213,764	0.7497
25 Feb 2013 02:12:22	1207421	15623334	hadcm3n_n50b_1880_40_008284802_1	259,200	193,766	0.7476
24 Feb 2013 20:37:29	1207421	15623334	hadcm3n_n50b_1880_40_008284802_1	233,280	173,782	0.7450
24 Feb 2013 15:01:00	1207421	15623334	hadcm3n_n50b_1880_40_008284802_1	207,360	153,475	0.7401
24 Feb 2013 09:10:32	1207421	15623334	hadcm3n_n50b_1880_40_008284802_1	181,440	132,621	0.7309
24 Feb 2013 03:23:15	1207421	15623334	hadcm3n_n50b_1880_40_008284802_1	155,520	111,789	0.7188
23 Feb 2013 22:00:33	1207421	15623334	hadcm3n_n50b_1880_40_008284802_1	129,600	92,380	0.7128
23 Feb 2013 17:36:33	1207421	15623334	hadcm3n_n50b_1880_40_008284802_1	103,680	73,927	0.7130
23 Feb 2013 11:42:44	1207421	15623334	hadcm3n_n50b_1880_40_008284802_1	77,760	55,428	0.7128
23 Feb 2013 06:36:41	1207421	15623334	hadcm3n_n50b_1880_40_008284802_1	51,840	36,975	0.7133
23 Feb 2013 02:20:45	1207421	15623334	hadcm3n_n50b_1880_40_008284802_1	25,920	18,483	0.7131