Task 14792786

Name	hadcm3n_o3yb_2060_40_008000574_0
Workunit	8155688
Created	15 Jun 2012, 20:23:38 UTC
Sent	15 Jun 2012, 20:23:50 UTC
Report deadline	15 Sep 2012, 3:51:01 UTC
Received	1 Aug 2012, 16:09:45 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1139618
Run time	19 days 3 hours 27 min 7 sec
CPU time	17 days 10 hours 14 min 36 sec
Validate state	Invalid
Credit	10,575.36
Device peak FLOPS	2.92 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.58</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 06:54:42 (2532): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 19:17:52 (2888): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 18:10:58 (1876): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 08:22:43 (2564): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2692, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2692, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2692, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2692, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2692, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2692, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
01 Aug 2012 16:11:48	1139618	14792786	hadcm3n_o3yb_2060_40_008000574_0	881,280	1,470,911	1.6691
30 Jul 2012 11:12:15	1139618	14792786	hadcm3n_o3yb_2060_40_008000574_0	855,360	1,427,571	1.6690
29 Jul 2012 10:04:33	1139618	14792786	hadcm3n_o3yb_2060_40_008000574_0	829,440	1,383,088	1.6675
28 Jul 2012 10:34:26	1139618	14792786	hadcm3n_o3yb_2060_40_008000574_0	803,520	1,338,734	1.6661
27 Jul 2012 13:47:05	1139618	14792786	hadcm3n_o3yb_2060_40_008000574_0	777,600	1,294,872	1.6652
27 Jul 2012 02:08:54	1139618	14792786	hadcm3n_o3yb_2060_40_008000574_0	751,680	1,251,722	1.6652
26 Jul 2012 13:31:27	1139618	14792786	hadcm3n_o3yb_2060_40_008000574_0	725,760	1,208,404	1.6650
25 Jul 2012 14:43:28	1139618	14792786	hadcm3n_o3yb_2060_40_008000574_0	699,840	1,164,162	1.6635
24 Jul 2012 15:20:42	1139618	14792786	hadcm3n_o3yb_2060_40_008000574_0	673,920	1,120,178	1.6622
23 Jul 2012 13:23:47	1139618	14792786	hadcm3n_o3yb_2060_40_008000574_0	648,000	1,076,551	1.6613
22 Jul 2012 13:02:47	1139618	14792786	hadcm3n_o3yb_2060_40_008000574_0	622,080	1,030,701	1.6569
21 Jul 2012 14:37:21	1139618	14792786	hadcm3n_o3yb_2060_40_008000574_0	596,160	986,135	1.6541
20 Jul 2012 16:08:30	1139618	14792786	hadcm3n_o3yb_2060_40_008000574_0	570,240	942,536	1.6529
18 Jul 2012 12:09:48	1139618	14792786	hadcm3n_o3yb_2060_40_008000574_0	544,320	899,098	1.6518
16 Jul 2012 16:48:40	1139618	14792786	hadcm3n_o3yb_2060_40_008000574_0	518,400	855,716	1.6507
15 Jul 2012 06:11:50	1139618	14792786	hadcm3n_o3yb_2060_40_008000574_0	492,480	811,074	1.6469
14 Jul 2012 10:05:15	1139618	14792786	hadcm3n_o3yb_2060_40_008000574_0	466,560	767,540	1.6451
12 Jul 2012 21:26:51	1139618	14792786	hadcm3n_o3yb_2060_40_008000574_0	440,640	724,155	1.6434
11 Jul 2012 11:59:23	1139618	14792786	hadcm3n_o3yb_2060_40_008000574_0	414,720	680,299	1.6404
10 Jul 2012 14:51:43	1139618	14792786	hadcm3n_o3yb_2060_40_008000574_0	388,800	637,161	1.6388