Task 15928898

Name	hadcm3n_zehl_1960_40_008320103_3
Workunit	8471238
Created	20 Aug 2013, 10:48:18 UTC
Sent	20 Aug 2013, 10:56:50 UTC
Report deadline	19 Nov 2013, 18:24:01 UTC
Received	12 Sep 2013, 2:28:42 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1191588
Run time	22 days 4 hours 21 min 39 sec
CPU time	21 days 8 hours 19 min 56 sec
Validate state	Invalid
Credit	7,153.92
Device peak FLOPS	1.51 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.58</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... 02:27:58 (8104): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 02:27:59 (8104): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 05:22:07 (14628): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=10216, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=10216, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=10216, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=10216, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=10216, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=10216, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
11 Sep 2013 17:53:29	1191588	15928898	hadcm3n_zehl_1960_40_008320103_3	596,160	1,823,950	3.0595
10 Sep 2013 18:32:03	1191588	15928898	hadcm3n_zehl_1960_40_008320103_3	570,240	1,744,751	3.0597
09 Sep 2013 20:09:08	1191588	15928898	hadcm3n_zehl_1960_40_008320103_3	544,320	1,665,451	3.0597
08 Sep 2013 19:29:55	1191588	15928898	hadcm3n_zehl_1960_40_008320103_3	518,400	1,583,601	3.0548
07 Sep 2013 20:37:45	1191588	15928898	hadcm3n_zehl_1960_40_008320103_3	492,480	1,504,221	3.0544
06 Sep 2013 21:51:19	1191588	15928898	hadcm3n_zehl_1960_40_008320103_3	466,560	1,424,952	3.0542
05 Sep 2013 23:28:10	1191588	15928898	hadcm3n_zehl_1960_40_008320103_3	440,640	1,345,724	3.0540
05 Sep 2013 00:41:13	1191588	15928898	hadcm3n_zehl_1960_40_008320103_3	414,720	1,266,560	3.0540
04 Sep 2013 00:28:00	1191588	15928898	hadcm3n_zehl_1960_40_008320103_3	388,800	1,187,643	3.0546
03 Sep 2013 00:52:11	1191588	15928898	hadcm3n_zehl_1960_40_008320103_3	362,880	1,108,449	3.0546
01 Sep 2013 22:19:59	1191588	15928898	hadcm3n_zehl_1960_40_008320103_3	336,960	1,029,253	3.0545
31 Aug 2013 22:00:42	1191588	15928898	hadcm3n_zehl_1960_40_008320103_3	311,040	946,443	3.0428
30 Aug 2013 22:49:57	1191588	15928898	hadcm3n_zehl_1960_40_008320103_3	285,120	865,810	3.0367
29 Aug 2013 23:37:13	1191588	15928898	hadcm3n_zehl_1960_40_008320103_3	259,200	785,144	3.0291
29 Aug 2013 01:27:38	1191588	15928898	hadcm3n_zehl_1960_40_008320103_3	233,280	706,094	3.0268
28 Aug 2013 00:45:41	1191588	15928898	hadcm3n_zehl_1960_40_008320103_3	207,360	627,743	3.0273
27 Aug 2013 02:39:25	1191588	15928898	hadcm3n_zehl_1960_40_008320103_3	181,440	549,387	3.0279
26 Aug 2013 04:53:14	1191588	15928898	hadcm3n_zehl_1960_40_008320103_3	155,520	471,073	3.0290
25 Aug 2013 06:22:36	1191588	15928898	hadcm3n_zehl_1960_40_008320103_3	129,600	392,850	3.0313
24 Aug 2013 08:23:05	1191588	15928898	hadcm3n_zehl_1960_40_008320103_3	103,680	314,292	3.0314