Task 15515032

Name	hadcm3n_3g0l_1940_40_008261328_4
Workunit	8416452
Created	28 Dec 2012, 15:21:51 UTC
Sent	28 Dec 2012, 15:26:10 UTC
Report deadline	29 Mar 2013, 22:53:21 UTC
Received	14 Jan 2013, 5:15:18 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1016612
Run time	12 days 6 hours 39 min 31 sec
CPU time	9 days 18 hours 11 min 56 sec
Validate state	Invalid
Credit	8,087.04
Device peak FLOPS	2.68 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.18</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1732, iMonCtr=1 Model crash detected, will try to restart... 16:10:15 (4156): No heartbeat from core client for 30 sec - exiting 16:10:16 (4156): No heartbeat from core client for 30 sec - exiting 16:10:17 (4156): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 07:54:16 (4300): No heartbeat from core client for 30 sec - exiting 07:54:17 (4300): No heartbeat from core client for 30 sec - exiting 07:54:18 (4300): No heartbeat from core client for 30 sec - exiting 07:54:19 (4300): No heartbeat from core client for 30 sec - exiting 07:54:20 (4300): No heartbeat from core client for 30 sec - exiting 07:54:21 (4300): No heartbeat from core client for 30 sec - exiting 07:54:22 (4300): No heartbeat from core client for 30 sec - exiting 07:54:23 (4300): No heartbeat from core client for 30 sec - exiting 07:54:24 (4300): No heartbeat from core client for 30 sec - exiting 07:54:25 (4300): No heartbeat from core client for 30 sec - exiting 07:54:26 (4300): No heartbeat from core client for 30 sec - exiting 07:54:27 (4300): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
13 Jan 2013 17:10:48	1016612	15515032	hadcm3n_3g0l_1940_40_008261328_4	673,920	1,024,863	1.5207
12 Jan 2013 23:07:36	1016612	15515032	hadcm3n_3g0l_1940_40_008261328_4	648,000	985,891	1.5214
12 Jan 2013 05:03:40	1016612	15515032	hadcm3n_3g0l_1940_40_008261328_4	622,080	945,626	1.5201
11 Jan 2013 13:20:15	1016612	15515032	hadcm3n_3g0l_1940_40_008261328_4	596,160	905,825	1.5194
10 Jan 2013 23:32:39	1016612	15515032	hadcm3n_3g0l_1940_40_008261328_4	570,240	866,191	1.5190
10 Jan 2013 00:32:13	1016612	15515032	hadcm3n_3g0l_1940_40_008261328_4	544,320	826,860	1.5191
09 Jan 2013 08:50:13	1016612	15515032	hadcm3n_3g0l_1940_40_008261328_4	518,400	786,511	1.5172
08 Jan 2013 16:10:58	1016612	15515032	hadcm3n_3g0l_1940_40_008261328_4	492,480	747,353	1.5175
08 Jan 2013 03:10:49	1016612	15515032	hadcm3n_3g0l_1940_40_008261328_4	466,560	708,383	1.5183
07 Jan 2013 07:25:42	1016612	15515032	hadcm3n_3g0l_1940_40_008261328_4	440,640	668,550	1.5172
06 Jan 2013 18:33:33	1016612	15515032	hadcm3n_3g0l_1940_40_008261328_4	414,720	628,743	1.5161
06 Jan 2013 06:50:44	1016612	15515032	hadcm3n_3g0l_1940_40_008261328_4	388,800	590,286	1.5182
05 Jan 2013 16:00:56	1016612	15515032	hadcm3n_3g0l_1940_40_008261328_4	362,880	551,322	1.5193
05 Jan 2013 05:00:02	1016612	15515032	hadcm3n_3g0l_1940_40_008261328_4	336,960	512,249	1.5202
04 Jan 2013 17:48:25	1016612	15515032	hadcm3n_3g0l_1940_40_008261328_4	311,040	472,088	1.5178
04 Jan 2013 06:39:51	1016612	15515032	hadcm3n_3g0l_1940_40_008261328_4	285,120	432,698	1.5176
03 Jan 2013 19:40:03	1016612	15515032	hadcm3n_3g0l_1940_40_008261328_4	259,200	393,057	1.5164
03 Jan 2013 07:25:39	1016612	15515032	hadcm3n_3g0l_1940_40_008261328_4	233,280	353,287	1.5144
02 Jan 2013 19:10:48	1016612	15515032	hadcm3n_3g0l_1940_40_008261328_4	207,360	313,223	1.5105
02 Jan 2013 08:14:58	1016612	15515032	hadcm3n_3g0l_1940_40_008261328_4	181,440	274,288	1.5117