Task 15642615

Name	hadcm3n_4mrj_1940_40_008308377_2
Workunit	8459512
Created	27 Feb 2013, 14:59:00 UTC
Sent	27 Feb 2013, 14:59:18 UTC
Report deadline	29 May 2013, 22:26:29 UTC
Received	17 Mar 2013, 17:44:06 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1193410
Run time	8 days 11 hours 19 min 28 sec
CPU time	8 days 9 hours 41 min 21 sec
Validate state	Invalid
Credit	7,464.96
Device peak FLOPS	2.96 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 14:19:11 (10384): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 09:21:33 (10548): No heartbeat from core client for 30 sec - exiting 09:23:36 (10548): No heartbeat from core client for 30 sec - exiting 09:23:37 (10548): No heartbeat from core client for 30 sec - exiting 09:23:38 (10548): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... 11:46:43 (8416): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 11:46:44 (8416): No heartbeat from core client for 30 sec - exiting 11:46:45 (8416): No heartbeat from core client for 30 sec - exiting 11:46:46 (8416): No heartbeat from core client for 30 sec - exiting 11:46:47 (8416): No heartbeat from core client for 30 sec - exiting 11:46:48 (8416): No heartbeat from core client for 30 sec - exiting 11:46:49 (8416): No heartbeat from core client for 30 sec - exiting 11:46:50 (8416): No heartbeat from core client for 30 sec - exiting 11:46:51 (8416): No heartbeat from core client for 30 sec - exiting 11:46:52 (8416): No heartbeat from core client for 30 sec - exiting 11:46:53 (8416): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 14:27:44 (12140): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 14:27:45 (12140): No heartbeat from core client for 30 sec - exiting 14:27:46 (12140): No heartbeat from core client for 30 sec - exiting 14:27:47 (12140): No heartbeat from core client for 30 sec - exiting 14:27:48 (12140): No heartbeat from core client for 30 sec - exiting 14:27:49 (12140): No heartbeat from core client for 30 sec - exiting 14:27:50 (12140): No heartbeat from core client for 30 sec - exiting 14:27:51 (12140): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3504, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3504, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3504, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5836, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5836, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5836, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5836, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5836, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5836, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
17 Mar 2013 00:47:14	1193410	15642615	hadcm3n_4mrj_1940_40_008308377_2	622,080	700,261	1.1257
16 Mar 2013 12:14:23	1193410	15642615	hadcm3n_4mrj_1940_40_008308377_2	596,160	669,934	1.1237
16 Mar 2013 03:46:33	1193410	15642615	hadcm3n_4mrj_1940_40_008308377_2	570,240	639,778	1.1219
15 Mar 2013 14:30:21	1193410	15642615	hadcm3n_4mrj_1940_40_008308377_2	544,320	609,559	1.1199
14 Mar 2013 19:06:32	1193410	15642615	hadcm3n_4mrj_1940_40_008308377_2	518,400	579,654	1.1182
14 Mar 2013 06:39:14	1193410	15642615	hadcm3n_4mrj_1940_40_008308377_2	492,480	550,198	1.1172
13 Mar 2013 06:04:14	1193410	15642615	hadcm3n_4mrj_1940_40_008308377_2	466,560	520,564	1.1157
12 Mar 2013 14:20:20	1193410	15642615	hadcm3n_4mrj_1940_40_008308377_2	440,640	491,317	1.1150
11 Mar 2013 23:28:45	1193410	15642615	hadcm3n_4mrj_1940_40_008308377_2	414,720	462,306	1.1147
11 Mar 2013 09:08:16	1193410	15642615	hadcm3n_4mrj_1940_40_008308377_2	388,800	432,542	1.1125
10 Mar 2013 20:48:00	1193410	15642615	hadcm3n_4mrj_1940_40_008308377_2	362,880	402,021	1.1079
10 Mar 2013 05:30:44	1193410	15642615	hadcm3n_4mrj_1940_40_008308377_2	336,960	371,432	1.1023
09 Mar 2013 07:27:00	1193410	15642615	hadcm3n_4mrj_1940_40_008308377_2	311,040	341,058	1.0965
08 Mar 2013 13:45:16	1193410	15642615	hadcm3n_4mrj_1940_40_008308377_2	285,120	310,738	1.0898
08 Mar 2013 00:08:31	1193410	15642615	hadcm3n_4mrj_1940_40_008308377_2	259,200	280,940	1.0839
07 Mar 2013 08:30:44	1193410	15642615	hadcm3n_4mrj_1940_40_008308377_2	233,280	252,341	1.0817
07 Mar 2013 08:30:44	1193410	15642615	hadcm3n_4mrj_1940_40_008308377_2	207,360	228,827	1.1035
04 Mar 2013 16:15:48	1193410	15642615	hadcm3n_4mrj_1940_40_008308377_2	181,440	201,235	1.1091
04 Mar 2013 08:18:19	1193410	15642615	hadcm3n_4mrj_1940_40_008308377_2	155,520	172,916	1.1119
03 Mar 2013 13:45:15	1193410	15642615	hadcm3n_4mrj_1940_40_008308377_2	129,600	144,020	1.1113