Task 14284380

Name	hadcm3n_ycqz_1940_40_007832502_1
Workunit	7987614
Created	18 Mar 2012, 18:06:43 UTC
Sent	18 Mar 2012, 18:22:33 UTC
Report deadline	18 Jun 2012, 1:49:44 UTC
Received	23 Aug 2012, 7:41:01 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1128195
Run time	13 days 15 hours 12 min 35 sec
CPU time	12 days 3 hours 29 min 58 sec
Validate state	Invalid
Credit	8,709.12
Device peak FLOPS	2.75 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.58</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 12:44:52 (9768): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 12:44:57 (9768): No heartbeat from core client for 30 sec - exiting 12:44:58 (9768): No heartbeat from core client for 30 sec - exiting 12:44:59 (9768): No heartbeat from core client for 30 sec - exiting 12:45:00 (9768): No heartbeat from core client for 30 sec - exiting 12:45:03 (9768): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=15076, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 09:52:50 (4132): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 09:55:44 (5440): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 10:00:21 (8088): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
17 Aug 2012 09:40:05	1128195	14284380	hadcm3n_ycqz_1940_40_007832502_1	725,760	1,024,316	1.4114
13 Aug 2012 08:34:19	1128195	14284380	hadcm3n_ycqz_1940_40_007832502_1	699,840	988,735	1.4128
09 Aug 2012 04:20:53	1128195	14284380	hadcm3n_ycqz_1940_40_007832502_1	673,920	952,753	1.4137
08 Aug 2012 18:08:52	1128195	14284380	hadcm3n_ycqz_1940_40_007832502_1	648,000	917,613	1.4161
03 Aug 2012 09:16:32	1128195	14284380	hadcm3n_ycqz_1940_40_007832502_1	622,080	882,352	1.4184
19 Jul 2012 15:57:39	1128195	14284380	hadcm3n_ycqz_1940_40_007832502_1	596,160	845,039	1.4175
19 Jul 2012 02:29:57	1128195	14284380	hadcm3n_ycqz_1940_40_007832502_1	570,240	805,664	1.4129
18 Jul 2012 13:55:10	1128195	14284380	hadcm3n_ycqz_1940_40_007832502_1	544,320	766,207	1.4076
17 Jul 2012 12:11:01	1128195	14284380	hadcm3n_ycqz_1940_40_007832502_1	518,400	727,787	1.4039
16 Jul 2012 08:06:21	1128195	14284380	hadcm3n_ycqz_1940_40_007832502_1	492,480	690,185	1.4014
13 Jul 2012 07:24:15	1128195	14284380	hadcm3n_ycqz_1940_40_007832502_1	466,560	652,374	1.3983
12 Jul 2012 14:32:56	1128195	14284380	hadcm3n_ycqz_1940_40_007832502_1	440,640	616,673	1.3995
11 Jul 2012 11:19:16	1128195	14284380	hadcm3n_ycqz_1940_40_007832502_1	414,720	579,453	1.3972
10 Jul 2012 09:25:31	1128195	14284380	hadcm3n_ycqz_1940_40_007832502_1	388,800	542,484	1.3953
09 Jul 2012 08:59:50	1128195	14284380	hadcm3n_ycqz_1940_40_007832502_1	362,880	507,487	1.3985
05 Jul 2012 13:24:15	1128195	14284380	hadcm3n_ycqz_1940_40_007832502_1	336,960	473,489	1.4052
03 Apr 2012 08:34:01	1128195	14284380	hadcm3n_ycqz_1940_40_007832502_1	311,040	437,936	1.4080
02 Apr 2012 21:47:38	1128195	14284380	hadcm3n_ycqz_1940_40_007832502_1	285,120	401,667	1.4088
30 Mar 2012 17:49:53	1128195	14284380	hadcm3n_ycqz_1940_40_007832502_1	259,200	366,658	1.4146
28 Mar 2012 16:00:34	1128195	14284380	hadcm3n_ycqz_1940_40_007832502_1	233,280	330,475	1.4166