Task 16067515

Name	hadcm3n_7wk0_1980_40_008453475_1
Workunit	8604331
Created	14 Oct 2013, 14:18:17 UTC
Sent	14 Oct 2013, 14:18:43 UTC
Report deadline	13 Jan 2014, 21:45:54 UTC
Received	22 Oct 2013, 5:25:10 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	21541
Run time	6 days 0 hours 32 min 49 sec
CPU time	5 days 3 hours 48 min 34 sec
Validate state	Invalid
Credit	5,287.68
Device peak FLOPS	3.62 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.64</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4800, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4800, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4800, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4800, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4800, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4800, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish 08:20:18 (4800): No heartbeat from core client for 30 sec - exiting 08:20:19 (4800): No heartbeat from core client for 30 sec - exiting </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
21 Oct 2013 17:16:17	21541	16067515	hadcm3n_7wk0_1980_40_008453475_1	440,640	434,361	0.9858
21 Oct 2013 08:58:34	21541	16067515	hadcm3n_7wk0_1980_40_008453475_1	414,720	408,748	0.9856
21 Oct 2013 01:00:45	21541	16067515	hadcm3n_7wk0_1980_40_008453475_1	388,800	383,169	0.9855
20 Oct 2013 16:16:22	21541	16067515	hadcm3n_7wk0_1980_40_008453475_1	362,880	357,708	0.9857
20 Oct 2013 03:42:01	21541	16067515	hadcm3n_7wk0_1980_40_008453475_1	336,960	331,942	0.9851
19 Oct 2013 16:31:38	21541	16067515	hadcm3n_7wk0_1980_40_008453475_1	311,040	306,484	0.9854
19 Oct 2013 02:23:14	21541	16067515	hadcm3n_7wk0_1980_40_008453475_1	285,120	280,881	0.9851
18 Oct 2013 12:47:06	21541	16067515	hadcm3n_7wk0_1980_40_008453475_1	259,200	255,422	0.9854
18 Oct 2013 04:14:00	21541	16067515	hadcm3n_7wk0_1980_40_008453475_1	233,280	230,089	0.9863
17 Oct 2013 20:20:03	21541	16067515	hadcm3n_7wk0_1980_40_008453475_1	207,360	204,770	0.9875
17 Oct 2013 08:33:16	21541	16067515	hadcm3n_7wk0_1980_40_008453475_1	181,440	179,010	0.9866
17 Oct 2013 00:24:07	21541	16067515	hadcm3n_7wk0_1980_40_008453475_1	155,520	153,560	0.9874
16 Oct 2013 12:41:35	21541	16067515	hadcm3n_7wk0_1980_40_008453475_1	129,600	127,858	0.9866
16 Oct 2013 04:33:22	21541	16067515	hadcm3n_7wk0_1980_40_008453475_1	103,680	102,176	0.9855
15 Oct 2013 19:50:29	21541	16067515	hadcm3n_7wk0_1980_40_008453475_1	77,760	76,833	0.9881
15 Oct 2013 09:21:17	21541	16067515	hadcm3n_7wk0_1980_40_008453475_1	51,840	51,179	0.9872
15 Oct 2013 01:27:00	21541	16067515	hadcm3n_7wk0_1980_40_008453475_1	25,920	25,566	0.9863