Task 16272682

Name	hadcm3n_7d1q_1980_40_008428193_2
Workunit	8579049
Created	16 Jan 2014, 2:09:09 UTC
Sent	16 Jan 2014, 2:09:18 UTC
Report deadline	20 Jul 2023, 7:29:18 UTC
Received	22 Feb 2014, 20:49:51 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1287141
Run time	9 days 18 hours 32 min 44 sec
CPU time	8 days 20 hours 1 min 52 sec
Validate state	Invalid
Credit	6,842.88
Device peak FLOPS	2.74 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.2.28</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=7596, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 01:16:34 (9320): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 06:50:16 (7424): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 10:15:15 (7032): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 13:58:11 (5796): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 17:17:05 (5080): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6584, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6584, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6584, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6584, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6584, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... 23:44:40 (6584): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 23:47:43 (18904): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=19672, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
12 Feb 2014 23:31:01	1287141	16272682	hadcm3n_7d1q_1980_40_008428193_2	570,240	746,962	1.3099
12 Feb 2014 11:52:03	1287141	16272682	hadcm3n_7d1q_1980_40_008428193_2	544,320	711,907	1.3079
12 Feb 2014 03:10:39	1287141	16272682	hadcm3n_7d1q_1980_40_008428193_2	518,400	681,969	1.3155
11 Feb 2014 11:46:28	1287141	16272682	hadcm3n_7d1q_1980_40_008428193_2	492,480	653,572	1.3271
11 Feb 2014 03:39:59	1287141	16272682	hadcm3n_7d1q_1980_40_008428193_2	466,560	625,189	1.3400
10 Feb 2014 19:08:23	1287141	16272682	hadcm3n_7d1q_1980_40_008428193_2	440,640	595,363	1.3511
09 Feb 2014 15:42:21	1287141	16272682	hadcm3n_7d1q_1980_40_008428193_2	414,720	562,173	1.3555
08 Feb 2014 22:13:33	1287141	16272682	hadcm3n_7d1q_1980_40_008428193_2	388,800	528,348	1.3589
07 Feb 2014 17:37:01	1287141	16272682	hadcm3n_7d1q_1980_40_008428193_2	362,880	494,877	1.3637
07 Feb 2014 00:23:49	1287141	16272682	hadcm3n_7d1q_1980_40_008428193_2	336,960	461,123	1.3685
04 Feb 2014 21:43:49	1287141	16272682	hadcm3n_7d1q_1980_40_008428193_2	311,040	427,449	1.3743
04 Feb 2014 12:04:37	1287141	16272682	hadcm3n_7d1q_1980_40_008428193_2	285,120	393,091	1.3787
22 Jan 2014 14:49:55	1287141	16272682	hadcm3n_7d1q_1980_40_008428193_2	259,200	358,329	1.3824
22 Jan 2014 01:16:59	1287141	16272682	hadcm3n_7d1q_1980_40_008428193_2	233,280	322,854	1.3840
20 Jan 2014 17:10:48	1287141	16272682	hadcm3n_7d1q_1980_40_008428193_2	207,360	287,750	1.3877
20 Jan 2014 06:54:54	1287141	16272682	hadcm3n_7d1q_1980_40_008428193_2	181,440	251,575	1.3865
19 Jan 2014 12:15:53	1287141	16272682	hadcm3n_7d1q_1980_40_008428193_2	155,520	215,804	1.3876
18 Jan 2014 12:33:13	1287141	16272682	hadcm3n_7d1q_1980_40_008428193_2	129,600	181,281	1.3988
18 Jan 2014 00:30:11	1287141	16272682	hadcm3n_7d1q_1980_40_008428193_2	103,680	146,135	1.4095
17 Jan 2014 14:18:30	1287141	16272682	hadcm3n_7d1q_1980_40_008428193_2	77,760	110,776	1.4246