Task 15674997

Name	hadcm3n_3dj1_1940_40_008258214_1
Workunit	8413338
Created	21 Mar 2013, 17:32:06 UTC
Sent	21 Mar 2013, 17:32:26 UTC
Report deadline	21 Jun 2013, 0:59:37 UTC
Received	10 Apr 2013, 13:01:38 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1274548
Run time	12 days 23 hours 13 min 32 sec
CPU time	12 days 13 hours 18 min 50 sec
Validate state	Invalid
Credit	7,153.92
Device peak FLOPS	2.32 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2892, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2892, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2892, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2892, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2360, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2360, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
03 Apr 2013 14:25:29	1274548	15674997	hadcm3n_3dj1_1940_40_008258214_1	596,160	1,073,665	1.8010
03 Apr 2013 00:57:26	1274548	15674997	hadcm3n_3dj1_1940_40_008258214_1	570,240	1,026,905	1.8008
02 Apr 2013 11:29:41	1274548	15674997	hadcm3n_3dj1_1940_40_008258214_1	544,320	980,162	1.8007
01 Apr 2013 22:04:29	1274548	15674997	hadcm3n_3dj1_1940_40_008258214_1	518,400	933,423	1.8006
01 Apr 2013 08:39:22	1274548	15674997	hadcm3n_3dj1_1940_40_008258214_1	492,480	886,667	1.8004
31 Mar 2013 19:12:12	1274548	15674997	hadcm3n_3dj1_1940_40_008258214_1	466,560	839,888	1.8002
31 Mar 2013 05:48:21	1274548	15674997	hadcm3n_3dj1_1940_40_008258214_1	440,640	793,218	1.8001
30 Mar 2013 16:20:46	1274548	15674997	hadcm3n_3dj1_1940_40_008258214_1	414,720	746,497	1.8000
30 Mar 2013 02:52:30	1274548	15674997	hadcm3n_3dj1_1940_40_008258214_1	388,800	699,737	1.7997
29 Mar 2013 13:27:41	1274548	15674997	hadcm3n_3dj1_1940_40_008258214_1	362,880	652,981	1.7994
29 Mar 2013 00:01:14	1274548	15674997	hadcm3n_3dj1_1940_40_008258214_1	336,960	606,289	1.7993
28 Mar 2013 10:34:17	1274548	15674997	hadcm3n_3dj1_1940_40_008258214_1	311,040	559,525	1.7989
27 Mar 2013 21:07:27	1274548	15674997	hadcm3n_3dj1_1940_40_008258214_1	285,120	512,724	1.7983
27 Mar 2013 07:36:53	1274548	15674997	hadcm3n_3dj1_1940_40_008258214_1	259,200	465,864	1.7973
26 Mar 2013 18:09:10	1274548	15674997	hadcm3n_3dj1_1940_40_008258214_1	233,280	419,056	1.7964
26 Mar 2013 04:44:33	1274548	15674997	hadcm3n_3dj1_1940_40_008258214_1	207,360	372,544	1.7966
25 Mar 2013 15:20:52	1274548	15674997	hadcm3n_3dj1_1940_40_008258214_1	181,440	325,990	1.7967
25 Mar 2013 02:50:47	1274548	15674997	hadcm3n_3dj1_1940_40_008258214_1	155,520	279,440	1.7968
24 Mar 2013 13:13:25	1274548	15674997	hadcm3n_3dj1_1940_40_008258214_1	129,600	232,841	1.7966
23 Mar 2013 23:39:02	1274548	15674997	hadcm3n_3dj1_1940_40_008258214_1	103,680	186,345	1.7973