Task 15783897

Name	hadcm3n_3k37_1940_40_008266470_4
Workunit	8421594
Created	14 May 2013, 13:56:15 UTC
Sent	14 May 2013, 13:56:49 UTC
Report deadline	13 Aug 2013, 21:24:00 UTC
Received	5 Jun 2013, 20:02:24 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1281641
Run time	12 days 6 hours 27 min 37 sec
CPU time	11 days 3 hours 24 min 52 sec
Validate state	Invalid
Credit	6,842.88
Device peak FLOPS	3.32 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.64</core_client_version> <![CDATA[ <message> Das Gerät erkennt den Befehl nicht. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4296, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4760, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CCPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 21:32:23 (4388): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 21:33:25 (4388): No heartbeat from core client for 30 sec - exiting 21:34:33 (4388): No heartbeat from core client for 30 sec - exiting 21:34:47 (4388): No heartbeat from core client for 30 sec - exiting 21:34:49 (4388): No heartbeat from core client for 30 sec - exiting 21:34:50 (4388): No heartbeat from core client for 30 sec - exiting 21:34:51 (4388): No heartbeat from core client for 30 sec - exiting 21:34:53 (4388): No heartbeat from core client for 30 sec - exiting 21:34:54 (4388): No heartbeat from core client for 30 sec - exiting 21:34:55 (4388): No heartbeat from core client for 30 sec - exiting 21:34:56 (4388): No heartbeat from core client for 30 sec - exiting 21:34:57 (4388): No heartbeat from core client for 30 sec - exiting 21:34:58 (4388): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3996, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3996, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3996, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3996, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3996, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3996, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
04 Jun 2013 22:30:32	1281641	15783897	hadcm3n_3k37_1940_40_008266470_4	570,240	931,123	1.6329
04 Jun 2013 00:40:00	1281641	15783897	hadcm3n_3k37_1940_40_008266470_4	544,320	890,178	1.6354
03 Jun 2013 01:37:55	1281641	15783897	hadcm3n_3k37_1940_40_008266470_4	518,400	849,487	1.6387
02 Jun 2013 12:40:05	1281641	15783897	hadcm3n_3k37_1940_40_008266470_4	492,480	808,727	1.6422
01 Jun 2013 22:49:55	1281641	15783897	hadcm3n_3k37_1940_40_008266470_4	466,560	767,093	1.6441
01 Jun 2013 01:17:39	1281641	15783897	hadcm3n_3k37_1940_40_008266470_4	440,640	725,550	1.6466
30 May 2013 05:22:53	1281641	15783897	hadcm3n_3k37_1940_40_008266470_4	414,720	684,002	1.6493
29 May 2013 16:54:51	1281641	15783897	hadcm3n_3k37_1940_40_008266470_4	388,800	642,243	1.6519
28 May 2013 05:22:29	1281641	15783897	hadcm3n_3k37_1940_40_008266470_4	362,880	600,906	1.6559
26 May 2013 22:50:31	1281641	15783897	hadcm3n_3k37_1940_40_008266470_4	336,960	558,731	1.6582
26 May 2013 07:59:49	1281641	15783897	hadcm3n_3k37_1940_40_008266470_4	311,040	516,482	1.6605
24 May 2013 21:42:53	1281641	15783897	hadcm3n_3k37_1940_40_008266470_4	285,120	474,695	1.6649
24 May 2013 01:15:15	1281641	15783897	hadcm3n_3k37_1940_40_008266470_4	259,200	431,432	1.6645
23 May 2013 02:56:01	1281641	15783897	hadcm3n_3k37_1940_40_008266470_4	233,280	388,513	1.6654
21 May 2013 06:02:00	1281641	15783897	hadcm3n_3k37_1940_40_008266470_4	207,360	345,674	1.6670
20 May 2013 16:39:54	1281641	15783897	hadcm3n_3k37_1940_40_008266470_4	181,440	301,966	1.6643
20 May 2013 01:23:20	1281641	15783897	hadcm3n_3k37_1940_40_008266470_4	155,520	258,488	1.6621
19 May 2013 10:32:47	1281641	15783897	hadcm3n_3k37_1940_40_008266470_4	129,600	215,115	1.6598
18 May 2013 05:07:16	1281641	15783897	hadcm3n_3k37_1940_40_008266470_4	103,680	172,920	1.6678
17 May 2013 04:23:45	1281641	15783897	hadcm3n_3k37_1940_40_008266470_4	77,760	130,018	1.6720