Task 15598464

Name	hadcm3n_4c8e_1940_40_008310974_0
Workunit	8462109
Created	8 Feb 2013, 2:50:01 UTC
Sent	8 Feb 2013, 23:57:04 UTC
Report deadline	11 May 2013, 7:24:15 UTC
Received	24 Feb 2013, 3:51:40 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1260009
Run time	12 days 4 hours 3 min 40 sec
CPU time	11 days 8 hours 8 min 44 sec
Validate state	Invalid
Credit	6,220.80
Device peak FLOPS	2.46 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 17:44:01 (2484): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3164, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4300, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3104, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3104, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3104, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3104, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3104, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
23 Feb 2013 01:00:26	1260009	15598464	hadcm3n_4c8e_1940_40_008310974_0	518,400	953,500	1.8393
22 Feb 2013 10:02:14	1260009	15598464	hadcm3n_4c8e_1940_40_008310974_0	492,480	905,986	1.8396
21 Feb 2013 19:07:04	1260009	15598464	hadcm3n_4c8e_1940_40_008310974_0	466,560	857,811	1.8386
21 Feb 2013 05:54:01	1260009	15598464	hadcm3n_4c8e_1940_40_008310974_0	440,640	811,019	1.8405
20 Feb 2013 16:20:46	1260009	15598464	hadcm3n_4c8e_1940_40_008310974_0	414,720	764,391	1.8431
20 Feb 2013 00:21:20	1260009	15598464	hadcm3n_4c8e_1940_40_008310974_0	388,800	716,733	1.8434
19 Feb 2013 11:08:45	1260009	15598464	hadcm3n_4c8e_1940_40_008310974_0	362,880	670,056	1.8465
18 Feb 2013 13:50:18	1260009	15598464	hadcm3n_4c8e_1940_40_008310974_0	336,960	623,506	1.8504
17 Feb 2013 23:36:12	1260009	15598464	hadcm3n_4c8e_1940_40_008310974_0	311,040	576,772	1.8543
17 Feb 2013 08:11:51	1260009	15598464	hadcm3n_4c8e_1940_40_008310974_0	285,120	527,425	1.8498
16 Feb 2013 15:30:41	1260009	15598464	hadcm3n_4c8e_1940_40_008310974_0	259,200	474,701	1.8314
16 Feb 2013 00:52:15	1260009	15598464	hadcm3n_4c8e_1940_40_008310974_0	233,280	423,187	1.8141
15 Feb 2013 10:17:25	1260009	15598464	hadcm3n_4c8e_1940_40_008310974_0	207,360	371,161	1.7899
14 Feb 2013 19:18:06	1260009	15598464	hadcm3n_4c8e_1940_40_008310974_0	181,440	320,399	1.7659
13 Feb 2013 16:20:47	1260009	15598464	hadcm3n_4c8e_1940_40_008310974_0	155,520	269,438	1.7325
13 Feb 2013 03:15:11	1260009	15598464	hadcm3n_4c8e_1940_40_008310974_0	129,600	223,566	1.7250
12 Feb 2013 14:35:56	1260009	15598464	hadcm3n_4c8e_1940_40_008310974_0	103,680	178,607	1.7227
12 Feb 2013 02:18:08	1260009	15598464	hadcm3n_4c8e_1940_40_008310974_0	77,760	134,422	1.7287
11 Feb 2013 14:00:27	1260009	15598464	hadcm3n_4c8e_1940_40_008310974_0	51,840	90,329	1.7425
11 Feb 2013 02:34:52	1260009	15598464	hadcm3n_4c8e_1940_40_008310974_0	25,920	46,039	1.7762