Task 11034165

Name	hadsm3dhet2_jqfd_006597243_7
Workunit	6800616
Created	15 Mar 2010, 12:03:38 UTC
Sent	28 Sep 2010, 9:18:50 UTC
Report deadline	10 Sep 2011, 14:38:50 UTC
Received	26 Oct 2010, 13:57:23 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	968672
Run time	4 days 17 hours 8 min 40 sec
CPU time	4 days 9 hours 13 min 14 sec
Validate state	Invalid
Credit	1,687.14
Device peak FLOPS	2.43 GFLOPS
Application version	UK Met Office HadSM3 Slab Model v6.07 windows_intelx86
Stderr	<core_client_version>6.10.58</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... forrtl: The requested operation cannot be performed on a file with a user-mapped section open. CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3888, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2776, iMonCtr=1 Model crash detected, will try to restart... CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2776, iMonCtr=1 Model crash detected, will try to restart... CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2776, iMonCtr=1 Model crash detected, will try to restart... CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2776, iMonCtr=1 Model crash detected, will try to restart... CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2776, iMonCtr=1 Model crash detected, will try to restart... CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2776, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
25 Oct 2010 15:59:04	968672	11034165	hadsm3dhet2_jqfd_006597243_7	183,634	375,754	2.0462
25 Oct 2010 09:09:48	968672	11034165	hadsm3dhet2_jqfd_006597243_7	172,832	352,445	2.0392
22 Oct 2010 11:23:22	968672	11034165	hadsm3dhet2_jqfd_006597243_7	162,030	329,153	2.0314
21 Oct 2010 14:01:35	968672	11034165	hadsm3dhet2_jqfd_006597243_7	151,228	306,117	2.0242
20 Oct 2010 16:10:44	968672	11034165	hadsm3dhet2_jqfd_006597243_7	140,426	283,121	2.0162
20 Oct 2010 09:11:40	968672	11034165	hadsm3dhet2_jqfd_006597243_7	129,624	259,781	2.0041
19 Oct 2010 11:45:00	968672	11034165	hadsm3dhet2_jqfd_006597243_7	118,822	236,758	1.9925
18 Oct 2010 13:46:13	968672	11034165	hadsm3dhet2_jqfd_006597243_7	108,020	213,773	1.9790
18 Oct 2010 07:37:22	968672	11034165	hadsm3dhet2_jqfd_006597243_7	97,218	192,236	1.9774
18 Oct 2010 07:37:22	968672	11034165	hadsm3dhet2_jqfd_006597243_7	86,416	174,319	2.0172
18 Oct 2010 07:37:22	968672	11034165	hadsm3dhet2_jqfd_006597243_7	75,614	152,155	2.0123
18 Oct 2010 07:37:22	968672	11034165	hadsm3dhet2_jqfd_006597243_7	64,812	127,537	1.9678
05 Oct 2010 13:18:14	968672	11034165	hadsm3dhet2_jqfd_006597243_7	54,010	103,060	1.9082
04 Oct 2010 15:55:46	968672	11034165	hadsm3dhet2_jqfd_006597243_7	43,208	81,151	1.8781
04 Oct 2010 10:17:46	968672	11034165	hadsm3dhet2_jqfd_006597243_7	32,406	61,295	1.8915
01 Oct 2010 13:00:02	968672	11034165	hadsm3dhet2_jqfd_006597243_7	21,604	42,407	1.9629
30 Sep 2010 16:25:13	968672	11034165	hadsm3dhet2_jqfd_006597243_7	10,802	22,687	2.1003