Task 15205917

Name	hadcm3n_o209_2100_40_008026847_3
Workunit	8181961
Created	30 Aug 2012, 10:22:47 UTC
Sent	30 Aug 2012, 10:23:20 UTC
Report deadline	29 Nov 2012, 17:50:31 UTC
Received	18 Sep 2012, 22:41:19 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1246786
Run time	7 days 4 hours 10 min 58 sec
CPU time	7 days 3 hours 4 min 58 sec
Validate state	Invalid
Credit	2,799.36
Device peak FLOPS	2.49 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.31</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=876, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 09:55:56 (4396): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 18:17:28 (5112): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 16:38:33 (4420): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4932, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3964, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3964, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3964, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3964, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3964, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
18 Sep 2012 12:36:19	1210080	15205917	hadcm3n_o209_2100_40_008026847_3	233,280	586,478	2.5141
15 Sep 2012 02:21:07	1210080	15205917	hadcm3n_o209_2100_40_008026847_3	207,360	514,413	2.4808
12 Sep 2012 16:50:20	1210080	15205917	hadcm3n_o209_2100_40_008026847_3	181,440	453,742	2.5008
10 Sep 2012 10:42:22	1210080	15205917	hadcm3n_o209_2100_40_008026847_3	155,520	391,095	2.5148
09 Sep 2012 07:49:53	1210080	15205917	hadcm3n_o209_2100_40_008026847_3	129,600	324,617	2.5048
08 Sep 2012 07:06:02	1210080	15205917	hadcm3n_o209_2100_40_008026847_3	103,680	258,077	2.4892
07 Sep 2012 01:22:52	1210080	15205917	hadcm3n_o209_2100_40_008026847_3	77,760	192,476	2.4753
05 Sep 2012 15:21:59	1210080	15205917	hadcm3n_o209_2100_40_008026847_3	51,840	128,148	2.4720
04 Sep 2012 05:05:22	1210080	15205917	hadcm3n_o209_2100_40_008026847_3	25,920	62,354	2.4056