Task 13022428

Name	hadcm3n_t2tc_1940_40_007314842_1
Workunit	7512272
Created	28 Jun 2011, 18:14:43 UTC
Sent	28 Jun 2011, 18:21:10 UTC
Report deadline	28 Sep 2011, 1:48:21 UTC
Received	9 Aug 2011, 23:33:38 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1072397
Run time	9 days 18 hours 30 min 3 sec
CPU time	8 days 23 hours 0 min 40 sec
Validate state	Invalid
Credit	5,909.76
Device peak FLOPS	2.49 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.18</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4828, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4436, iMonCtr=1 Model crash detected, will try to restart... 17:39:11 (4956): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... C12:57:53 (4924): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 23:20:40 (2536): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7012, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7012, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... 08:08:18 (5020): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal =16:24:04 (5100): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
05 Aug 2011 16:29:52	1072397	13022428	hadcm3n_t2tc_1940_40_007314842_1	492,480	739,513	1.5016
03 Aug 2011 17:59:32	1072397	13022428	hadcm3n_t2tc_1940_40_007314842_1	466,560	700,377	1.5012
01 Aug 2011 22:55:33	1072397	13022428	hadcm3n_t2tc_1940_40_007314842_1	440,640	660,947	1.5000
29 Jul 2011 20:02:24	1072397	13022428	hadcm3n_t2tc_1940_40_007314842_1	414,720	621,452	1.4985
28 Jul 2011 14:12:29	1072397	13022428	hadcm3n_t2tc_1940_40_007314842_1	388,800	582,938	1.4993
27 Jul 2011 13:14:10	1072397	13022428	hadcm3n_t2tc_1940_40_007314842_1	362,880	544,763	1.5012
26 Jul 2011 11:35:16	1072397	13022428	hadcm3n_t2tc_1940_40_007314842_1	336,960	506,152	1.5021
26 Jul 2011 01:00:02	1072397	13022428	hadcm3n_t2tc_1940_40_007314842_1	311,040	468,041	1.5048
25 Jul 2011 19:44:48	1072397	13022428	hadcm3n_t2tc_1940_40_007314842_1	285,120	429,430	1.5061
25 Jul 2011 19:17:50	1072397	13022428	hadcm3n_t2tc_1940_40_007314842_1	259,200	391,055	1.5087
25 Jul 2011 19:17:43	1072397	13022428	hadcm3n_t2tc_1940_40_007314842_1	233,280	351,490	1.5067
25 Jul 2011 18:05:06	1072397	13022428	hadcm3n_t2tc_1940_40_007314842_1	207,360	310,881	1.4992
25 Jul 2011 17:47:16	1072397	13022428	hadcm3n_t2tc_1940_40_007314842_1	181,440	272,752	1.5033
25 Jul 2011 17:29:04	1072397	13022428	hadcm3n_t2tc_1940_40_007314842_1	155,520	234,177	1.5058
25 Jul 2011 13:25:57	1072397	13022428	hadcm3n_t2tc_1940_40_007314842_1	129,600	195,565	1.5090
25 Jul 2011 13:25:56	1072397	13022428	hadcm3n_t2tc_1940_40_007314842_1	103,680	156,632	1.5107
25 Jul 2011 13:25:56	1072397	13022428	hadcm3n_t2tc_1940_40_007314842_1	77,760	118,442	1.5232
25 Jul 2011 13:25:56	1072397	13022428	hadcm3n_t2tc_1940_40_007314842_1	51,840	79,660	1.5367
30 Jun 2011 14:39:01	1072397	13022428	hadcm3n_t2tc_1940_40_007314842_1	25,920	39,276	1.5153