Task 15926895

Name	hadcm3n_zkff_1960_40_008405523_0
Workunit	8556379
Created	20 Aug 2013, 2:46:40 UTC
Sent	20 Aug 2013, 2:48:17 UTC
Report deadline	19 Nov 2013, 10:15:28 UTC
Received	4 Sep 2013, 21:44:23 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1286770
Run time	10 days 1 hours 44 min 6 sec
CPU time	9 days 5 hours 11 min 54 sec
Validate state	Invalid
Credit	8,709.12
Device peak FLOPS	4.03 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.64</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6516, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4724, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=872, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=872, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=872, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=872, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3352, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3352, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3352, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
03 Sep 2013 16:23:39	1286770	15926895	hadcm3n_zkff_1960_40_008405523_0	725,760	778,234	1.0723
03 Sep 2013 06:59:44	1286770	15926895	hadcm3n_zkff_1960_40_008405523_0	699,840	748,814	1.0700
02 Sep 2013 20:35:19	1286770	15926895	hadcm3n_zkff_1960_40_008405523_0	673,920	719,010	1.0669
02 Sep 2013 06:38:14	1286770	15926895	hadcm3n_zkff_1960_40_008405523_0	648,000	689,635	1.0643
01 Sep 2013 16:27:22	1286770	15926895	hadcm3n_zkff_1960_40_008405523_0	622,080	661,164	1.0628
01 Sep 2013 05:48:06	1286770	15926895	hadcm3n_zkff_1960_40_008405523_0	596,160	634,031	1.0635
31 Aug 2013 18:14:18	1286770	15926895	hadcm3n_zkff_1960_40_008405523_0	570,240	606,203	1.0631
31 Aug 2013 06:38:50	1286770	15926895	hadcm3n_zkff_1960_40_008405523_0	544,320	577,703	1.0613
30 Aug 2013 07:42:20	1286770	15926895	hadcm3n_zkff_1960_40_008405523_0	518,400	548,874	1.0588
29 Aug 2013 08:49:00	1286770	15926895	hadcm3n_zkff_1960_40_008405523_0	492,480	521,642	1.0592
28 Aug 2013 23:57:21	1286770	15926895	hadcm3n_zkff_1960_40_008405523_0	466,560	492,920	1.0565
28 Aug 2013 04:46:55	1286770	15926895	hadcm3n_zkff_1960_40_008405523_0	440,640	464,836	1.0549
27 Aug 2013 20:59:24	1286770	15926895	hadcm3n_zkff_1960_40_008405523_0	414,720	438,247	1.0567
27 Aug 2013 02:49:27	1286770	15926895	hadcm3n_zkff_1960_40_008405523_0	388,800	412,737	1.0616
26 Aug 2013 18:41:30	1286770	15926895	hadcm3n_zkff_1960_40_008405523_0	362,880	384,475	1.0595
26 Aug 2013 10:04:42	1286770	15926895	hadcm3n_zkff_1960_40_008405523_0	336,960	355,450	1.0549
26 Aug 2013 01:37:10	1286770	15926895	hadcm3n_zkff_1960_40_008405523_0	311,040	326,691	1.0503
25 Aug 2013 17:04:48	1286770	15926895	hadcm3n_zkff_1960_40_008405523_0	285,120	298,285	1.0462
24 Aug 2013 21:30:58	1286770	15926895	hadcm3n_zkff_1960_40_008405523_0	259,200	271,085	1.0459
24 Aug 2013 14:04:25	1286770	15926895	hadcm3n_zkff_1960_40_008405523_0	233,280	245,250	1.0513