Task 15855771

Name	hadcm3n_zco2_1960_40_008393906_0
Workunit	8544765
Created	22 Jun 2013, 0:47:33 UTC
Sent	22 Jun 2013, 1:05:42 UTC
Report deadline	21 Sep 2013, 8:32:53 UTC
Received	9 Jul 2013, 3:37:22 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1255219
Run time	7 days 18 hours 15 min 19 sec
CPU time	6 days 2 hours 2 min 42 sec
Validate state	Invalid
Credit	4,976.64
Device peak FLOPS	2.95 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.64</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 17:59:23 (7228): No heartbeat from core client for 30 sec - exiting 17:59:24 (7228): No heartbeat from core client for 30 sec - exiting 17:59:25 (7228): No heartbeat from core client for 30 sec - exiting 17:59:26 (7228): No heartbeat from core client for 30 sec - exiting 17:59:27 (7228): No heartbeat from core client for 30 sec - exiting 17:59:28 (7228): No heartbeat from core client for 30 sec - exiting 17:59:29 (7228): No heartbeat from core client for 30 sec - exiting 17:59:30 (7228): No heartbeat from core client for 30 sec - exiting 17:59:31 (7228): No heartbeat from core client for 30 sec - exiting 17:59:32 (7228): No heartbeat from core client for 30 sec - exiting 17:59:33 (7228): No heartbeat from core client for 30 sec - exiting 17:59:34 (7228): No heartbeat from core client for 30 sec - exiting 17:59:35 (7228): No heartbeat from core client for 30 sec - exiting 17:59:36 (7228): No heartbeat from core client for 30 sec - exiting 17:59:37 (7228): No heartbeat from core client for 30 sec - exiting 17:59:38 (7228): No heartbeat from core client for 30 sec - exiting 17:59:39 (7228): No heartbeat from core client for 30 sec - exiting 17:59:40 (7228): No heartbeat from core client for 30 sec - exiting 17:59:41 (7228): No heartbeat from core client for 30 sec - exiting 17:59:42 (7228): No heartbeat from core client for 30 sec - exiting 17:59:43 (7228): No heartbeat from core client for 30 sec - exiting 17:59:44 (7228): No heartbeat from core client for 30 sec - exiting 17:59:45 (7228): No heartbeat from core client for 30 sec - exiting 17:59:46 (7228): No heartbeat from core client for 30 sec - exiting 17:59:47 (7228): No heartbeat from core client for 30 sec - exiting 17:59:48 (7228): No heartbeat from core client for 30 sec - exiting 17:59:49 (7228): No heartbeat from core client for 30 sec - exiting 17:59:50 (7228): No heartbeat from core client for 30 sec - exiting 17:59:51 (7228): No heartbeat from core client for 30 sec - exiting 17:59:52 (7228): No heartbeat from core client for 30 sec - exiting 17:59:53 (7228): No heartbeat from core client for 30 sec - exiting 17:59:54 (7228): No heartbeat from core client for 30 sec - exiting 17:59:55 (7228): No heartbeat from core client for 30 sec - exiting 17:59:56 (7228): No heartbeat from core client for 30 sec - exiting 17:59:57 (7228): No heartbeat from core client for 30 sec - exiting 17:59:58 (7228): No heartbeat from core client for 30 sec - exiting 17:59:59 (7228): No heartbeat from core client for 30 sec - exiting 18:00:00 (7228): No heartbeat from core client for 30 sec - exiting 18:00:01 (7228): No heartbeat from core client for 30 sec - exiting 18:00:02 (7228): No heartbeat from core client for 30 sec - exiting 18:00:03 (7228): No heartbeat from core client for 30 sec - exiting 18:00:04 (7228): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 18:00:05 (7228): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 21:38:25 (6112): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=14256, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=14256, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=14256, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=14256, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=14256, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=14256, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
08 Jul 2013 16:14:18	1255219	15855771	hadcm3n_zco2_1960_40_008393906_0	414,720	496,584	1.1974
08 Jul 2013 05:11:30	1255219	15855771	hadcm3n_zco2_1960_40_008393906_0	388,800	463,965	1.1933
07 Jul 2013 19:07:09	1255219	15855771	hadcm3n_zco2_1960_40_008393906_0	362,880	431,446	1.1889
07 Jul 2013 08:10:54	1255219	15855771	hadcm3n_zco2_1960_40_008393906_0	336,960	399,743	1.1863
06 Jul 2013 20:54:56	1255219	15855771	hadcm3n_zco2_1960_40_008393906_0	311,040	368,486	1.1847
06 Jul 2013 15:09:13	1255219	15855771	hadcm3n_zco2_1960_40_008393906_0	285,120	336,534	1.1803
06 Jul 2013 05:37:06	1255219	15855771	hadcm3n_zco2_1960_40_008393906_0	259,200	306,312	1.1818
06 Jul 2013 04:59:50	1255219	15855771	hadcm3n_zco2_1960_40_008393906_0	233,280	276,453	1.1851
06 Jul 2013 04:16:48	1255219	15855771	hadcm3n_zco2_1960_40_008393906_0	207,360	246,560	1.1890
04 Jul 2013 14:26:52	1255219	15855771	hadcm3n_zco2_1960_40_008393906_0	181,440	215,828	1.1895
04 Jul 2013 14:03:31	1255219	15855771	hadcm3n_zco2_1960_40_008393906_0	155,520	184,770	1.1881
03 Jul 2013 12:57:27	1255219	15855771	hadcm3n_zco2_1960_40_008393906_0	129,600	154,092	1.1890
02 Jul 2013 12:06:11	1255219	15855771	hadcm3n_zco2_1960_40_008393906_0	103,680	124,006	1.1960
02 Jul 2013 11:54:56	1255219	15855771	hadcm3n_zco2_1960_40_008393906_0	77,760	93,287	1.1997
02 Jul 2013 11:25:46	1255219	15855771	hadcm3n_zco2_1960_40_008393906_0	51,840	62,583	1.2072
02 Jul 2013 11:03:45	1255219	15855771	hadcm3n_zco2_1960_40_008393906_0	25,920	31,882	1.2300