Task 15846580

Name	hadcm3n_39jd_1980_40_008366398_4
Workunit	8517257
Created	17 Jun 2013, 17:28:53 UTC
Sent	17 Jun 2013, 17:45:19 UTC
Report deadline	17 Sep 2013, 1:12:30 UTC
Received	17 Aug 2013, 12:45:45 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1282399
Run time	16 days 18 hours 37 min 32 sec
CPU time	16 days 8 hours 27 min 13 sec
Validate state	Invalid
Credit	8,087.04
Device peak FLOPS	2.67 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.64</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 22:18:43 (6184): No heartbeat from core client for 30 sec - exiting 22:18:44 (6184): No heartbeat from core client for 30 sec - exiting 22:18:45 (6184): No heartbeat from core client for 30 sec - exiting 22:18:46 (6184): No heartbeat from core client for 30 sec - exiting 22:18:47 (6184): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 09:18:41 (6760): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6992, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5204, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5204, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5204, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5204, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5204, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
17 Aug 2013 12:50:21	1282399	15846580	hadcm3n_39jd_1980_40_008366398_4	673,920	1,373,543	2.0381
17 Aug 2013 12:50:21	1282399	15846580	hadcm3n_39jd_1980_40_008366398_4	648,000	1,324,408	2.0438
17 Aug 2013 12:50:21	1282399	15846580	hadcm3n_39jd_1980_40_008366398_4	622,080	1,273,992	2.0480
17 Aug 2013 12:50:21	1282399	15846580	hadcm3n_39jd_1980_40_008366398_4	596,160	1,222,622	2.0508
17 Aug 2013 12:50:21	1282399	15846580	hadcm3n_39jd_1980_40_008366398_4	570,240	1,169,732	2.0513
17 Aug 2013 12:50:21	1282399	15846580	hadcm3n_39jd_1980_40_008366398_4	544,320	1,116,775	2.0517
17 Aug 2013 12:50:21	1282399	15846580	hadcm3n_39jd_1980_40_008366398_4	518,400	1,064,685	2.0538
17 Aug 2013 12:50:21	1282399	15846580	hadcm3n_39jd_1980_40_008366398_4	492,480	1,013,323	2.0576
03 Jul 2013 19:51:00	1282399	15846580	hadcm3n_39jd_1980_40_008366398_4	466,560	960,967	2.0597
03 Jul 2013 04:09:18	1282399	15846580	hadcm3n_39jd_1980_40_008366398_4	440,640	907,108	2.0586
02 Jul 2013 12:59:07	1282399	15846580	hadcm3n_39jd_1980_40_008366398_4	414,720	854,049	2.0593
02 Jul 2013 11:57:17	1282399	15846580	hadcm3n_39jd_1980_40_008366398_4	388,800	800,961	2.0601
02 Jul 2013 11:14:52	1282399	15846580	hadcm3n_39jd_1980_40_008366398_4	362,880	747,770	2.0607
02 Jul 2013 10:42:48	1282399	15846580	hadcm3n_39jd_1980_40_008366398_4	336,960	694,147	2.0600
02 Jul 2013 10:20:47	1282399	15846580	hadcm3n_39jd_1980_40_008366398_4	311,040	640,423	2.0590
02 Jul 2013 09:59:22	1282399	15846580	hadcm3n_39jd_1980_40_008366398_4	285,120	587,377	2.0601
28 Jun 2013 14:10:48	1282399	15846580	hadcm3n_39jd_1980_40_008366398_4	259,200	534,759	2.0631
27 Jun 2013 22:57:59	1282399	15846580	hadcm3n_39jd_1980_40_008366398_4	233,280	481,214	2.0628
27 Jun 2013 07:43:32	1282399	15846580	hadcm3n_39jd_1980_40_008366398_4	207,360	427,760	2.0629
26 Jun 2013 16:28:41	1282399	15846580	hadcm3n_39jd_1980_40_008366398_4	181,440	374,011	2.0613