Task 15771422

Name	hadcm3n_4hqf_1940_40_008311695_1
Workunit	8462830
Created	10 May 2013, 12:58:12 UTC
Sent	10 May 2013, 12:58:14 UTC
Report deadline	9 Aug 2013, 20:25:25 UTC
Received	3 Jun 2013, 15:57:20 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1203014
Run time	14 days 10 hours 16 min 5 sec
CPU time	8 days 0 hours 59 min 8 sec
Validate state	Invalid
Credit	9,331.20
Device peak FLOPS	2.82 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 08:01:12 (95672): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=109616, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
03 Jun 2013 07:17:24	1203014	15771422	hadcm3n_4hqf_1940_40_008311695_1	777,600	1,160,857	1.4929
02 Jun 2013 20:27:25	1203014	15771422	hadcm3n_4hqf_1940_40_008311695_1	751,680	1,123,120	1.4941
02 Jun 2013 09:34:01	1203014	15771422	hadcm3n_4hqf_1940_40_008311695_1	725,760	1,085,391	1.4955
01 Jun 2013 23:40:16	1203014	15771422	hadcm3n_4hqf_1940_40_008311695_1	699,840	1,047,619	1.4969
01 Jun 2013 11:50:32	1203014	15771422	hadcm3n_4hqf_1940_40_008311695_1	673,920	1,009,876	1.4985
01 Jun 2013 01:02:26	1203014	15771422	hadcm3n_4hqf_1940_40_008311695_1	648,000	972,137	1.5002
31 May 2013 10:52:05	1203014	15771422	hadcm3n_4hqf_1940_40_008311695_1	622,080	931,240	1.4970
31 May 2013 00:02:52	1203014	15771422	hadcm3n_4hqf_1940_40_008311695_1	596,160	893,514	1.4988
30 May 2013 12:21:03	1203014	15771422	hadcm3n_4hqf_1940_40_008311695_1	570,240	853,691	1.4971
30 May 2013 01:30:13	1203014	15771422	hadcm3n_4hqf_1940_40_008311695_1	544,320	815,921	1.4990
29 May 2013 13:59:45	1203014	15771422	hadcm3n_4hqf_1940_40_008311695_1	518,400	776,297	1.4975
29 May 2013 02:55:56	1203014	15771422	hadcm3n_4hqf_1940_40_008311695_1	492,480	737,772	1.4981
28 May 2013 15:16:07	1203014	15771422	hadcm3n_4hqf_1940_40_008311695_1	466,560	697,847	1.4957
28 May 2013 03:11:40	1203014	15771422	hadcm3n_4hqf_1940_40_008311695_1	440,640	659,576	1.4969
27 May 2013 16:37:02	1203014	15771422	hadcm3n_4hqf_1940_40_008311695_1	414,720	621,843	1.4994
27 May 2013 05:17:46	1203014	15771422	hadcm3n_4hqf_1940_40_008311695_1	388,800	584,050	1.5022
26 May 2013 17:17:56	1203014	15771422	hadcm3n_4hqf_1940_40_008311695_1	362,880	546,388	1.5057
26 May 2013 06:59:33	1203014	15771422	hadcm3n_4hqf_1940_40_008311695_1	336,960	508,590	1.5093
25 May 2013 19:18:55	1203014	15771422	hadcm3n_4hqf_1940_40_008311695_1	311,040	470,927	1.5140
25 May 2013 08:22:00	1203014	15771422	hadcm3n_4hqf_1940_40_008311695_1	285,120	433,324	1.5198