Task 13849943

Name	hadcm3n_yf7n_1940_40_007614523_4
Workunit	7792653
Created	2 Jan 2012, 13:50:18 UTC
Sent	2 Jan 2012, 13:53:01 UTC
Report deadline	2 Apr 2012, 21:20:12 UTC
Received	7 Feb 2012, 6:51:15 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	20652
Run time	14 days 12 hours 43 min 20 sec
CPU time	11 days 4 hours 20 min 32 sec
Validate state	Invalid
Credit	7,776.00
Device peak FLOPS	2.36 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.57</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 18:03:35 (3596): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 10:07:12 (152116): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 10:07:14 (152116): No heartbeat from core client for 30 sec - exiting 10:07:15 (152116): No heartbeat from core client for 30 sec - exiting 10:07:16 (152116): No heartbeat from core client for 30 sec - exiting 10:07:17 (152116): No heartbeat from core client for 30 sec - exiting 10:07:18 (152116): No heartbeat from core client for 30 sec - exiting 10:07:19 (152116): No heartbeat from core client for 30 sec - exiting 10:07:20 (152116): No heartbeat from core client for 30 sec - exiting 10:07:21 (152116): No heartbeat from core client for 30 sec - exiting 10:07:22 (152116): No heartbeat from core client for 30 sec - exiting 10:07:23 (152116): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 14:07:15 (400): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 14:07:16 (400): No heartbeat from core client for 30 sec - exiting 14:07:17 (400): No heartbeat from core client for 30 sec - exiting 14:07:18 (400): No heartbeat from core client for 30 sec - exiting 14:07:19 (400): No heartbeat from core client for 30 sec - exiting 14:07:20 (400): No heartbeat from core client for 30 sec - exiting 14:07:21 (400): No heartbeat from core client for 30 sec - exiting 14:07:22 (400): No heartbeat from core client for 30 sec - exiting 14:07:23 (400): No heartbeat from core client for 30 sec - exiting 14:07:24 (400): No heartbeat from core client for 30 sec - exiting 14:07:25 (400): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 19:05:07 (656): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 19:05:08 (656): No heartbeat from core client for 30 sec - exiting 19:05:09 (656): No heartbeat from core client for 30 sec - exiting 19:05:10 (656): No heartbeat from core client for 30 sec - exiting 19:05:11 (656): No heartbeat from core client for 30 sec - exiting 19:05:12 (656): No heartbeat from core client for 30 sec - exiting 19:05:13 (656): No heartbeat from core client for 30 sec - exiting 19:05:14 (656): No heartbeat from core client for 30 sec - exiting 19:05:15 (656): No heartbeat from core client for 30 sec - exiting 19:05:16 (656): No heartbeat from core client for 30 sec - exiting 19:05:17 (656): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
06 Feb 2012 19:16:14	20652	13849943	hadcm3n_yf7n_1940_40_007614523_4	648,000	1,172,223	1.8090
06 Feb 2012 03:28:50	20652	13849943	hadcm3n_yf7n_1940_40_007614523_4	622,080	1,124,906	1.8083
05 Feb 2012 12:53:50	20652	13849943	hadcm3n_yf7n_1940_40_007614523_4	596,160	1,077,412	1.8073
04 Feb 2012 21:58:15	20652	13849943	hadcm3n_yf7n_1940_40_007614523_4	570,240	1,030,637	1.8074
04 Feb 2012 08:05:20	20652	13849943	hadcm3n_yf7n_1940_40_007614523_4	544,320	982,404	1.8048
03 Feb 2012 15:47:56	20652	13849943	hadcm3n_yf7n_1940_40_007614523_4	518,400	936,171	1.8059
02 Feb 2012 23:33:03	20652	13849943	hadcm3n_yf7n_1940_40_007614523_4	492,480	888,748	1.8046
02 Feb 2012 06:44:55	20652	13849943	hadcm3n_yf7n_1940_40_007614523_4	466,560	841,208	1.8030
01 Feb 2012 15:52:55	20652	13849943	hadcm3n_yf7n_1940_40_007614523_4	440,640	794,447	1.8029
01 Feb 2012 02:02:47	20652	13849943	hadcm3n_yf7n_1940_40_007614523_4	414,720	747,834	1.8032
31 Jan 2012 06:55:20	20652	13849943	hadcm3n_yf7n_1940_40_007614523_4	388,800	701,502	1.8043
30 Jan 2012 12:47:32	20652	13849943	hadcm3n_yf7n_1940_40_007614523_4	362,880	656,132	1.8081
29 Jan 2012 22:47:44	20652	13849943	hadcm3n_yf7n_1940_40_007614523_4	336,960	608,868	1.8069
29 Jan 2012 08:32:49	20652	13849943	hadcm3n_yf7n_1940_40_007614523_4	311,040	561,863	1.8064
28 Jan 2012 16:52:32	20652	13849943	hadcm3n_yf7n_1940_40_007614523_4	285,120	515,134	1.8067
28 Jan 2012 01:05:29	20652	13849943	hadcm3n_yf7n_1940_40_007614523_4	259,200	468,601	1.8079
27 Jan 2012 11:01:09	20652	13849943	hadcm3n_yf7n_1940_40_007614523_4	233,280	420,625	1.8031
26 Jan 2012 20:24:48	20652	13849943	hadcm3n_yf7n_1940_40_007614523_4	207,360	374,197	1.8046
26 Jan 2012 02:36:06	20652	13849943	hadcm3n_yf7n_1940_40_007614523_4	181,440	327,675	1.8060
25 Jan 2012 12:14:37	20652	13849943	hadcm3n_yf7n_1940_40_007614523_4	155,520	281,539	1.8103