Task 15419569

Name	hadcm3n_zev1_1880_40_008242687_0
Workunit	8397811
Created	30 Oct 2012, 13:44:16 UTC
Sent	30 Oct 2012, 13:44:29 UTC
Report deadline	29 Jan 2013, 21:11:40 UTC
Received	20 Nov 2012, 18:52:03 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1077037
Run time	17 days 4 hours 53 min 40 sec
CPU time	16 days 0 hours 1 min
Validate state	Invalid
Credit	5,909.76
Device peak FLOPS	1.95 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 01:25:57 (7056): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 04:20:24 (740): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 04:26:36 (7648): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 04:28:26 (6896): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=816, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=816, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=816, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=816, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=816, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=816, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
20 Nov 2012 15:52:02	1077037	15419569	hadcm3n_zev1_1880_40_008242687_0	492,480	1,370,332	2.7825
19 Nov 2012 17:35:07	1077037	15419569	hadcm3n_zev1_1880_40_008242687_0	466,560	1,313,836	2.8160
18 Nov 2012 14:15:30	1077037	15419569	hadcm3n_zev1_1880_40_008242687_0	440,640	1,242,455	2.8197
16 Nov 2012 11:41:15	1077037	15419569	hadcm3n_zev1_1880_40_008242687_0	414,720	1,155,437	2.7861
15 Nov 2012 07:44:13	1077037	15419569	hadcm3n_zev1_1880_40_008242687_0	388,800	1,069,854	2.7517
13 Nov 2012 22:12:29	1077037	15419569	hadcm3n_zev1_1880_40_008242687_0	362,880	984,232	2.7123
12 Nov 2012 19:35:10	1077037	15419569	hadcm3n_zev1_1880_40_008242687_0	336,960	917,414	2.7226
11 Nov 2012 06:32:26	1077037	15419569	hadcm3n_zev1_1880_40_008242687_0	311,040	830,545	2.6702
10 Nov 2012 06:45:40	1077037	15419569	hadcm3n_zev1_1880_40_008242687_0	285,120	759,539	2.6639
08 Nov 2012 18:52:07	1077037	15419569	hadcm3n_zev1_1880_40_008242687_0	259,200	672,421	2.5942
07 Nov 2012 14:53:26	1077037	15419569	hadcm3n_zev1_1880_40_008242687_0	233,280	588,114	2.5211
06 Nov 2012 18:02:25	1077037	15419569	hadcm3n_zev1_1880_40_008242687_0	207,360	514,642	2.4819
06 Nov 2012 00:34:33	1077037	15419569	hadcm3n_zev1_1880_40_008242687_0	181,440	453,566	2.4998
05 Nov 2012 14:09:02	1077037	15419569	hadcm3n_zev1_1880_40_008242687_0	155,520	413,467	2.6586
04 Nov 2012 22:41:23	1077037	15419569	hadcm3n_zev1_1880_40_008242687_0	129,600	362,177	2.7946
03 Nov 2012 23:24:13	1077037	15419569	hadcm3n_zev1_1880_40_008242687_0	103,680	287,388	2.7719
03 Nov 2012 05:14:18	1077037	15419569	hadcm3n_zev1_1880_40_008242687_0	77,760	221,528	2.8489
02 Nov 2012 16:05:58	1077037	15419569	hadcm3n_zev1_1880_40_008242687_0	51,840	163,639	3.1566
31 Oct 2012 14:15:42	1077037	15419569	hadcm3n_zev1_1880_40_008242687_0	25,920	84,508	3.2603