Task 15820670

Name	hadcm3n_o01m_1980_40_008385394_0
Workunit	8536253
Created	3 Jun 2013, 3:03:14 UTC
Sent	11 Jun 2013, 12:53:11 UTC
Report deadline	10 Sep 2013, 20:20:22 UTC
Received	18 Jul 2013, 12:56:11 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1241522
Run time	8 days 6 hours 50 min 50 sec
CPU time	7 days 22 hours 7 min 12 sec
Validate state	Invalid
Credit	6,220.80
Device peak FLOPS	3.36 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> Il dispositivo non riconosce il comando. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2192, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5704, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 16:55:59 (4556): No heartbeat from core client for 30 sec - exiting 16:56:00 (4556): No heartbeat from core client for 30 sec - exiting 16:56:01 (4556): No heartbeat from core client for 30 sec - exiting 16:56:02 (4556): No heartbeat from core client for 30 sec - exiting 16:56:03 (4556): No heartbeat from core client for 30 sec - exiting 16:56:04 (4556): No heartbeat from core client for 30 sec - exiting 16:56:05 (4556): No heartbeat from core client for 30 sec - exiting 16:56:06 (4556): No heartbeat from core client for 30 sec - exiting 16:56:07 (4556): No heartbeat from core client for 30 sec - exiting 16:56:09 (4556): No heartbeat from core client for 30 sec - exiting 16:56:10 (4556): No heartbeat from core client for 30 sec - exiting 16:56:11 (4556): No heartbeat from core client for 30 sec - exiting 16:56:12 (4556): No heartbeat from core client for 30 sec - exiting 16:56:13 (4556): No heartbeat from core client for 30 sec - exiting 16:56:14 (4556): No heartbeat from core client for 30 sec - exiting 16:56:15 (4556): No heartbeat from core client for 30 sec - exiting 16:56:16 (4556): No heartbeat from core client for 30 sec - exiting 16:56:17 (4556): No heartbeat from core client for 30 sec - exiting 16:56:18 (4556): No heartbeat from core client for 30 sec - exiting 16:56:19 (4556): No heartbeat from core client for 30 sec - exiting 16:56:21 (4556): No heartbeat from core client for 30 sec - exiting 16:56:22 (4556): No heartbeat from core client for 30 sec - exiting 16:56:23 (4556): No heartbeat from core client for 30 sec - exiting 16:56:24 (4556): No heartbeat from core client for 30 sec - exiting 16:56:25 (4556): No heartbeat from core client for 30 sec - exiting 16:56:26 (4556): No heartbeat from core client for 30 sec - exiting 16:56:27 (4556): No heartbeat from core client for 30 sec - exiting 16:56:28 (4556): No heartbeat from core client for 30 sec - exiting 16:56:29 (4556): No heartbeat from core client for 30 sec - exiting 16:56:30 (4556): No heartbeat from core client for 30 sec - exiting 16:56:31 (4556): No heartbeat from core client for 30 sec - exiting 16:56:33 (4556): No heartbeat from core client for 30 sec - exiting 16:56:34 (4556): No heartbeat from core client for 30 sec - exiting 16:56:35 (4556): No heartbeat from core client for 30 sec - exiting 16:56:36 (4556): No heartbeat from core client for 30 sec - exiting 16:56:37 (4556): No heartbeat from core client for 30 sec - exiting 16:56:38 (4556): No heartbeat from core client for 30 sec - exiting 16:56:39 (4556): No heartbeat from core client for 30 sec - exiting 16:56:40 (4556): No heartbeat from core client for 30 sec - exiting 16:56:41 (4556): No heartbeat from core client for 30 sec - exiting 16:56:42 (4556): No heartbeat from core client for 30 sec - exiting 16:56:43 (4556): No heartbeat from core client for 30 sec - exiting 16:56:45 (4556): No heartbeat from core client for 30 sec - exiting 16:56:46 (4556): No heartbeat from core client for 30 sec - exiting 16:56:47 (4556): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4928, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4928, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4928, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4928, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4928, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4928, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
23 Jul 2013 16:18:18	1241522	15820670	hadcm3n_o01m_1980_40_008385394_0	518,400	657,046	1.2674
23 Jul 2013 16:18:18	1241522	15820670	hadcm3n_o01m_1980_40_008385394_0	492,480	619,753	1.2584
23 Jul 2013 16:18:18	1241522	15820670	hadcm3n_o01m_1980_40_008385394_0	466,560	583,863	1.2514
23 Jul 2013 16:18:17	1241522	15820670	hadcm3n_o01m_1980_40_008385394_0	440,640	552,424	1.2537
23 Jul 2013 16:18:17	1241522	15820670	hadcm3n_o01m_1980_40_008385394_0	414,720	527,951	1.2730
11 Jul 2013 20:49:53	1241522	15820670	hadcm3n_o01m_1980_40_008385394_0	388,800	494,714	1.2724
11 Jul 2013 10:31:37	1241522	15820670	hadcm3n_o01m_1980_40_008385394_0	362,880	459,180	1.2654
10 Jul 2013 23:57:36	1241522	15820670	hadcm3n_o01m_1980_40_008385394_0	336,960	422,195	1.2530
10 Jul 2013 14:17:04	1241522	15820670	hadcm3n_o01m_1980_40_008385394_0	311,040	388,543	1.2492
08 Jul 2013 10:47:50	1241522	15820670	hadcm3n_o01m_1980_40_008385394_0	285,120	356,503	1.2504
01 Jul 2013 03:44:09	1241522	15820670	hadcm3n_o01m_1980_40_008385394_0	259,200	325,042	1.2540
26 Jun 2013 14:47:27	1241522	15820670	hadcm3n_o01m_1980_40_008385394_0	233,280	293,592	1.2585
25 Jun 2013 15:29:54	1241522	15820670	hadcm3n_o01m_1980_40_008385394_0	207,360	262,289	1.2649
24 Jun 2013 14:42:33	1241522	15820670	hadcm3n_o01m_1980_40_008385394_0	181,440	230,752	1.2718
21 Jun 2013 13:41:16	1241522	15820670	hadcm3n_o01m_1980_40_008385394_0	155,520	205,828	1.3235
19 Jun 2013 15:04:12	1241522	15820670	hadcm3n_o01m_1980_40_008385394_0	129,600	174,814	1.3489
18 Jun 2013 13:58:13	1241522	15820670	hadcm3n_o01m_1980_40_008385394_0	103,680	140,292	1.3531
14 Jun 2013 15:06:30	1241522	15820670	hadcm3n_o01m_1980_40_008385394_0	77,760	103,755	1.3343
13 Jun 2013 13:35:44	1241522	15820670	hadcm3n_o01m_1980_40_008385394_0	51,840	68,142	1.3145
12 Jun 2013 14:16:08	1241522	15820670	hadcm3n_o01m_1980_40_008385394_0	25,920	34,280	1.3225