Task 15752932

Name	hadcm3n_zedf_1920_40_008282377_3
Workunit	8433512
Created	27 Apr 2013, 7:41:30 UTC
Sent	27 Apr 2013, 7:41:52 UTC
Report deadline	27 Jul 2013, 15:09:03 UTC
Received	4 Jun 2013, 1:09:16 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1266469
Run time	22 days 21 hours 4 min 58 sec
CPU time	21 days 2 hours 22 min 11 sec
Validate state	Invalid
Credit	11,508.48
Device peak FLOPS	2.39 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.64</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 13:44:10 (7120): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 13:44:12 (7120): No heartbeat from core client for 30 sec - exiting 13:44:13 (7120): No heartbeat from core client for 30 sec - exiting 13:44:14 (7120): No heartbeat from core client for 30 sec - exiting 13:44:15 (7120): No heartbeat from core client for 30 sec - exiting 13:44:16 (7120): No heartbeat from core client for 30 sec - exiting 13:44:17 (7120): No heartbeat from core client for 30 sec - exiting 13:44:18 (7120): No heartbeat from core client for 30 sec - exiting 13:44:19 (7120): No heartbeat from core client for 30 sec - exiting 13:44:20 (7120): No heartbeat from core client for 30 sec - exiting 13:44:21 (7120): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... Atmos Hold Restart file rename failed on atmos_restart.hold CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 23:09:15 (5388): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4500, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4500, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3888, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3888, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3888, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3888, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
27 May 2013 03:01:55	1266469	15752932	hadcm3n_zedf_1920_40_008282377_3	959,040	1,818,764	1.8964
26 May 2013 13:21:27	1266469	15752932	hadcm3n_zedf_1920_40_008282377_3	933,120	1,770,413	1.8973
26 May 2013 00:12:40	1266469	15752932	hadcm3n_zedf_1920_40_008282377_3	907,200	1,723,844	1.9002
25 May 2013 10:57:49	1266469	15752932	hadcm3n_zedf_1920_40_008282377_3	881,280	1,676,855	1.9027
24 May 2013 21:47:54	1266469	15752932	hadcm3n_zedf_1920_40_008282377_3	855,360	1,630,052	1.9057
24 May 2013 07:57:37	1266469	15752932	hadcm3n_zedf_1920_40_008282377_3	829,440	1,582,165	1.9075
23 May 2013 17:22:21	1266469	15752932	hadcm3n_zedf_1920_40_008282377_3	803,520	1,533,059	1.9079
22 May 2013 23:34:47	1266469	15752932	hadcm3n_zedf_1920_40_008282377_3	777,600	1,484,050	1.9085
22 May 2013 07:32:50	1266469	15752932	hadcm3n_zedf_1920_40_008282377_3	751,680	1,434,549	1.9085
21 May 2013 18:06:29	1266469	15752932	hadcm3n_zedf_1920_40_008282377_3	725,760	1,385,857	1.9095
21 May 2013 01:30:21	1266469	15752932	hadcm3n_zedf_1920_40_008282377_3	699,840	1,336,061	1.9091
20 May 2013 09:51:16	1266469	15752932	hadcm3n_zedf_1920_40_008282377_3	673,920	1,285,167	1.9070
19 May 2013 19:03:08	1266469	15752932	hadcm3n_zedf_1920_40_008282377_3	648,000	1,236,586	1.9083
19 May 2013 03:15:14	1266469	15752932	hadcm3n_zedf_1920_40_008282377_3	622,080	1,186,562	1.9074
18 May 2013 14:00:37	1266469	15752932	hadcm3n_zedf_1920_40_008282377_3	596,160	1,138,589	1.9099
17 May 2013 22:29:29	1266469	15752932	hadcm3n_zedf_1920_40_008282377_3	570,240	1,089,226	1.9101
17 May 2013 08:05:09	1266469	15752932	hadcm3n_zedf_1920_40_008282377_3	544,320	1,040,688	1.9119
16 May 2013 16:01:05	1266469	15752932	hadcm3n_zedf_1920_40_008282377_3	518,400	990,680	1.9110
15 May 2013 22:02:50	1266469	15752932	hadcm3n_zedf_1920_40_008282377_3	492,480	939,711	1.9081
15 May 2013 08:00:14	1266469	15752932	hadcm3n_zedf_1920_40_008282377_3	466,560	891,038	1.9098