Task 15501776

Name	hadcm3n_o1m7_2140_40_008269007_0
Workunit	8424131
Created	23 Dec 2012, 21:39:46 UTC
Sent	24 Dec 2012, 11:20:36 UTC
Report deadline	25 Mar 2013, 18:47:47 UTC
Received	3 Jan 2013, 5:52:46 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1356796
Run time	9 days 17 hours 5 min 32 sec
CPU time	9 days 2 hours 13 min 1 sec
Validate state	Invalid
Credit	5,287.68
Device peak FLOPS	2.90 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 22:55:24 (5920): No heartbeat from core client for 30 sec - exiting 22:55:25 (5920): No heartbeat from core client for 30 sec - exiting 22:55:26 (5920): No heartbeat from core client for 30 sec - exiting 22:55:27 (5920): No heartbeat from core client for 30 sec - exiting 22:55:28 (5920): No heartbeat from core client for 30 sec - exiting 22:55:29 (5920): No heartbeat from core client for 30 sec - exiting 22:55:30 (5920): No heartbeat from core client for 30 sec - exiting 22:55:31 (5920): No heartbeat from core client for 30 sec - exiting 22:55:32 (5920): No heartbeat from core client for 30 sec - exiting 22:55:33 (5920): No heartbeat from core client for 30 sec - exiting 22:55:34 (5920): No heartbeat from core client for 30 sec - exiting 22:55:35 (5920): No heartbeat from core client for 30 sec - exiting 22:55:36 (5920): No heartbeat from core client for 30 sec - exiting 22:55:37 (5920): No heartbeat from core client for 30 sec - exiting 22:55:38 (5920): No heartbeat from core client for 30 sec - exiting 22:55:39 (5920): No heartbeat from core client for 30 sec - exiting 22:55:40 (5920): No heartbeat from core client for 30 sec - exiting 22:55:41 (5920): No heartbeat from core client for 30 sec - exiting 22:55:42 (5920): No heartbeat from core client for 30 sec - exiting 22:55:43 (5920): No heartbeat from core client for 30 sec - exiting 22:55:44 (5920): No heartbeat from core client for 30 sec - exiting 22:55:45 (5920): No heartbeat from core client for 30 sec - exiting 22:55:46 (5920): No heartbeat from core client for 30 sec - exiting 22:55:47 (5920): No heartbeat from core client for 30 sec - exiting 22:55:48 (5920): No heartbeat from core client for 30 sec - exiting 22:55:49 (5920): No heartbeat from core client for 30 sec - exiting 22:55:50 (5920): No heartbeat from core client for 30 sec - exiting 22:55:51 (5920): No heartbeat from core client for 30 sec - exiting 22:55:52 (5920): No heartbeat from core client for 30 sec - exiting 22:55:53 (5920): No heartbeat from core client for 30 sec - exiting 22:55:54 (5920): No heartbeat from core client for 30 sec - exiting 22:55:55 (5920): No heartbeat from core client for 30 sec - exiting 22:55:56 (5920): No heartbeat from core client for 30 sec - exiting 22:55:57 (5920): No heartbeat from core client for 30 sec - exiting 22:55:58 (5920): No heartbeat from core client for 30 sec - exiting 22:55:59 (5920): No heartbeat from core client for 30 sec - exiting 22:56:00 (5920): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6736, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6736, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6736, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6736, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6736, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6736, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
03 Jan 2013 03:29:51	1209938	15501776	hadcm3n_o1m7_2140_40_008269007_0	440,640	776,552	1.7623
02 Jan 2013 15:26:39	1209938	15501776	hadcm3n_o1m7_2140_40_008269007_0	414,720	737,322	1.7779
02 Jan 2013 04:19:09	1209938	15501776	hadcm3n_o1m7_2140_40_008269007_0	388,800	698,232	1.7959
01 Jan 2013 16:51:13	1209938	15501776	hadcm3n_o1m7_2140_40_008269007_0	362,880	658,867	1.8157
01 Jan 2013 05:35:43	1209938	15501776	hadcm3n_o1m7_2140_40_008269007_0	336,960	620,175	1.8405
31 Dec 2012 17:56:46	1209938	15501776	hadcm3n_o1m7_2140_40_008269007_0	311,040	580,845	1.8674
31 Dec 2012 06:43:03	1209938	15501776	hadcm3n_o1m7_2140_40_008269007_0	285,120	542,605	1.9031
30 Dec 2012 18:45:29	1209938	15501776	hadcm3n_o1m7_2140_40_008269007_0	259,200	503,090	1.9409
30 Dec 2012 07:54:14	1209938	15501776	hadcm3n_o1m7_2140_40_008269007_0	233,280	464,604	1.9916
29 Dec 2012 19:38:03	1209938	15501776	hadcm3n_o1m7_2140_40_008269007_0	207,360	426,149	2.0551
29 Dec 2012 08:20:16	1209938	15501776	hadcm3n_o1m7_2140_40_008269007_0	181,440	387,716	2.1369
28 Dec 2012 20:46:26	1209938	15501776	hadcm3n_o1m7_2140_40_008269007_0	155,520	349,554	2.2476
28 Dec 2012 09:19:31	1209938	15501776	hadcm3n_o1m7_2140_40_008269007_0	129,600	311,361	2.4025
27 Dec 2012 21:56:40	1209938	15501776	hadcm3n_o1m7_2140_40_008269007_0	103,680	272,958	2.6327
25 Dec 2012 21:30:54	1209938	15501776	hadcm3n_o1m7_2140_40_008269007_0	77,760	115,403	1.4841
25 Dec 2012 10:17:51	1209938	15501776	hadcm3n_o1m7_2140_40_008269007_0	51,840	77,189	1.4890
24 Dec 2012 22:50:11	1209938	15501776	hadcm3n_o1m7_2140_40_008269007_0	25,920	38,566	1.4879