Task 11034168

Name	hadsm3dhet2_jqfe_006597244_0
Workunit	6800617
Created	15 Mar 2010, 12:03:38 UTC
Sent	28 Sep 2010, 9:18:16 UTC
Report deadline	10 Sep 2011, 14:38:16 UTC
Received	26 Oct 2010, 13:57:23 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	968672
Run time	4 days 16 hours 52 min 29 sec
CPU time	4 days 8 hours 52 min 28 sec
Validate state	Invalid
Credit	1,687.14
Device peak FLOPS	2.43 GFLOPS
Application version	UK Met Office HadSM3 Slab Model v6.07 windows_intelx86
Stderr	<core_client_version>6.10.58</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... error: cannot delete old hadsm3dhet2_jqfe_006597244/jobs/climate.cont error: cannot delete old hadsm3dhet2_jqfe_006597244/jobs/climate.doub CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... error: cannot delete old hadsm3dhet2_jqfe_006597244/jobs/climate.spin CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... forrtl: The requested operation cannot be performed on a file with a user-mapped section open. CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2748, iMonCtr=1 Model crash detected, will try to restart... CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2748, iMonCtr=1 Model crash detected, will try to restart... CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2748, iMonCtr=1 Model crash detected, will try to restart... CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2748, iMonCtr=1 Model crash detected, will try to restart... CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2748, iMonCtr=1 Model crash detected, will try to restart... CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2748, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
25 Oct 2010 16:04:14	968672	11034168	hadsm3dhet2_jqfe_006597244_0	183,634	374,860	2.0413
25 Oct 2010 09:20:10	968672	11034168	hadsm3dhet2_jqfe_006597244_0	172,832	351,802	2.0355
22 Oct 2010 11:38:37	968672	11034168	hadsm3dhet2_jqfe_006597244_0	162,030	329,070	2.0309
21 Oct 2010 14:06:45	968672	11034168	hadsm3dhet2_jqfe_006597244_0	151,228	306,414	2.0262
20 Oct 2010 16:41:12	968672	11034168	hadsm3dhet2_jqfe_006597244_0	140,426	283,317	2.0176
20 Oct 2010 09:52:20	968672	11034168	hadsm3dhet2_jqfe_006597244_0	129,624	260,512	2.0098
19 Oct 2010 12:24:24	968672	11034168	hadsm3dhet2_jqfe_006597244_0	118,822	237,484	1.9987
18 Oct 2010 14:32:05	968672	11034168	hadsm3dhet2_jqfe_006597244_0	108,020	214,091	1.9820
18 Oct 2010 07:37:22	968672	11034168	hadsm3dhet2_jqfe_006597244_0	97,218	191,505	1.9699
18 Oct 2010 07:37:22	968672	11034168	hadsm3dhet2_jqfe_006597244_0	86,416	173,759	2.0107
18 Oct 2010 07:37:22	968672	11034168	hadsm3dhet2_jqfe_006597244_0	75,614	152,495	2.0168
18 Oct 2010 07:37:22	968672	11034168	hadsm3dhet2_jqfe_006597244_0	64,812	128,098	1.9765
05 Oct 2010 14:04:43	968672	11034168	hadsm3dhet2_jqfe_006597244_0	54,010	104,092	1.9273
04 Oct 2010 16:21:23	968672	11034168	hadsm3dhet2_jqfe_006597244_0	43,208	81,794	1.8930
04 Oct 2010 10:33:11	968672	11034168	hadsm3dhet2_jqfe_006597244_0	32,406	61,711	1.9043
01 Oct 2010 13:05:09	968672	11034168	hadsm3dhet2_jqfe_006597244_0	21,604	42,010	1.9445
30 Sep 2010 16:30:43	968672	11034168	hadsm3dhet2_jqfe_006597244_0	10,802	22,488	2.0818