Task 16605211

Name	hadcm3n_8crm_1980_40_008725965_1
Workunit	8871943
Created	30 Apr 2014, 16:31:55 UTC
Sent	30 Apr 2014, 17:23:10 UTC
Report deadline	31 Jul 2014, 0:50:21 UTC
Received	2 Aug 2014, 9:27:03 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1319436
Run time	7 days 4 hours 26 min 25 sec
CPU time	6 days 15 hours 40 min 6 sec
Validate state	Invalid
Credit	5,598.72
Device peak FLOPS	3.63 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.2.42</core_client_version> <![CDATA[ <message> Le périphérique ne reconnaît pas la commande. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6472, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 09:56:59 (6576): No heartbeat from core client for 30 sec - exiting 09:57:00 (6576): No heartbeat from core client for 30 sec - exiting 09:57:01 (6576): No heartbeat from core client for 30 sec - exiting 09:57:02 (6576): No heartbeat from core client for 30 sec - exiting 09:57:03 (6576): No heartbeat from core client for 30 sec - exiting 09:57:04 (6576): No heartbeat from core client for 30 sec - exiting 09:57:05 (6576): No heartbeat from core client for 30 sec - exiting 09:57:06 (6576): No heartbeat from core client for 30 sec - exiting 09:57:07 (6576): No heartbeat from core client for 30 sec - exiting 09:57:08 (6576): No heartbeat from core client for 30 sec - exiting 09:57:09 (6576): No heartbeat from core client for 30 sec - exiting 09:57:10 (6576): No heartbeat from core client for 30 sec - exiting 09:57:11 (6576): No heartbeat from core client for 30 sec - exiting 09:57:12 (6576): No heartbeat from core client for 30 sec - exiting 09:57:13 (6576): No heartbeat from core client for 30 sec - exiting 09:57:14 (6576): No heartbeat from core client for 30 sec - exiting 09:57:15 (6576): No heartbeat from core client for 30 sec - exiting 09:57:16 (6576): No heartbeat from core client for 30 sec - exiting 09:57:17 (6576): No heartbeat from core client for 30 sec - exiting 09:57:18 (6576): No heartbeat from core client for 30 sec - exiting 09:57:19 (6576): No heartbeat from core client for 30 sec - exiting 09:57:20 (6576): No heartbeat from core client for 30 sec - exiting 09:57:21 (6576): No heartbeat from core client for 30 sec - exiting 09:57:22 (6576): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6724, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6724, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6724, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6724, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6724, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6724, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
30 Jul 2014 07:24:58	1319436	16605211	hadcm3n_8crm_1980_40_008725965_1	466,560	546,032	1.1703
26 Jul 2014 06:20:03	1319436	16605211	hadcm3n_8crm_1980_40_008725965_1	440,640	516,566	1.1723
19 Jul 2014 15:58:24	1319436	16605211	hadcm3n_8crm_1980_40_008725965_1	414,720	487,248	1.1749
19 Jul 2014 06:34:37	1319436	16605211	hadcm3n_8crm_1980_40_008725965_1	388,800	457,999	1.1780
01 Jul 2014 10:31:43	1319436	16605211	hadcm3n_8crm_1980_40_008725965_1	362,880	428,822	1.1817
27 Jun 2014 18:51:04	1319436	16605211	hadcm3n_8crm_1980_40_008725965_1	336,960	399,143	1.1845
27 Jun 2014 10:33:24	1319436	16605211	hadcm3n_8crm_1980_40_008725965_1	311,040	369,885	1.1892
24 Jun 2014 18:14:03	1319436	16605211	hadcm3n_8crm_1980_40_008725965_1	285,120	340,479	1.1942
24 Jun 2014 09:42:34	1319436	16605211	hadcm3n_8crm_1980_40_008725965_1	259,200	309,918	1.1957
23 Jun 2014 12:30:34	1319436	16605211	hadcm3n_8crm_1980_40_008725965_1	233,280	281,741	1.2077
10 May 2014 04:42:29	1319436	16605211	hadcm3n_8crm_1980_40_008725965_1	207,360	251,130	1.2111
09 May 2014 08:13:01	1319436	16605211	hadcm3n_8crm_1980_40_008725965_1	181,440	220,882	1.2174
07 May 2014 11:34:21	1319436	16605211	hadcm3n_8crm_1980_40_008725965_1	155,520	189,496	1.2185
06 May 2014 15:02:51	1319436	16605211	hadcm3n_8crm_1980_40_008725965_1	129,600	157,712	1.2169
06 May 2014 05:15:37	1319436	16605211	hadcm3n_8crm_1980_40_008725965_1	103,680	125,951	1.2148
05 May 2014 06:53:24	1319436	16605211	hadcm3n_8crm_1980_40_008725965_1	77,760	93,912	1.2077
03 May 2014 13:54:22	1319436	16605211	hadcm3n_8crm_1980_40_008725965_1	51,840	62,370	1.2031
01 May 2014 14:14:38	1319436	16605211	hadcm3n_8crm_1980_40_008725965_1	25,920	31,087	1.1993