Task 16036074

Name	hadcm3n_7wgz_1980_40_008453366_2
Workunit	8604222
Created	27 Sep 2013, 7:45:34 UTC
Sent	27 Sep 2013, 7:46:07 UTC
Report deadline	27 Dec 2013, 15:13:18 UTC
Received	11 Oct 2013, 14:28:20 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1241630
Run time	7 days 18 hours 36 min 55 sec
CPU time	6 days 7 hours 33 min 24 sec
Validate state	Invalid
Credit	4,665.60
Device peak FLOPS	3.10 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.64</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 20:15:14 (10248): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 20:15:18 (10248): No heartbeat from core client for 30 sec - exiting 20:15:19 (10248): No heartbeat from core client for 30 sec - exiting 20:15:20 (10248): No heartbeat from core client for 30 sec - exiting 20:15:21 (10248): No heartbeat from core client for 30 sec - exiting 20:15:22 (10248): No heartbeat from core client for 30 sec - exiting 20:15:23 (10248): No heartbeat from core client for 30 sec - exiting 20:15:24 (10248): No heartbeat from core client for 30 sec - exiting 20:15:25 (10248): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CCPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=12844, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=12844, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=12844, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=12844, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=12844, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=12844, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
09 Oct 2013 07:46:55	1241630	16036074	hadcm3n_7wgz_1980_40_008453366_2	388,800	523,657	1.3469
08 Oct 2013 18:05:17	1241630	16036074	hadcm3n_7wgz_1980_40_008453366_2	362,880	489,365	1.3486
06 Oct 2013 05:17:36	1241630	16036074	hadcm3n_7wgz_1980_40_008453366_2	336,960	454,823	1.3498
05 Oct 2013 17:26:33	1241630	16036074	hadcm3n_7wgz_1980_40_008453366_2	311,040	420,746	1.3527
05 Oct 2013 07:38:33	1241630	16036074	hadcm3n_7wgz_1980_40_008453366_2	285,120	385,958	1.3537
04 Oct 2013 18:47:24	1241630	16036074	hadcm3n_7wgz_1980_40_008453366_2	259,200	351,405	1.3557
04 Oct 2013 08:56:27	1241630	16036074	hadcm3n_7wgz_1980_40_008453366_2	233,280	316,701	1.3576
03 Oct 2013 22:46:09	1241630	16036074	hadcm3n_7wgz_1980_40_008453366_2	207,360	281,856	1.3593
03 Oct 2013 12:12:50	1241630	16036074	hadcm3n_7wgz_1980_40_008453366_2	181,440	247,348	1.3632
03 Oct 2013 01:37:55	1241630	16036074	hadcm3n_7wgz_1980_40_008453366_2	155,520	212,778	1.3682
02 Oct 2013 12:33:46	1241630	16036074	hadcm3n_7wgz_1980_40_008453366_2	129,600	177,634	1.3706
02 Oct 2013 00:08:20	1241630	16036074	hadcm3n_7wgz_1980_40_008453366_2	103,680	142,344	1.3729
01 Oct 2013 11:47:16	1241630	16036074	hadcm3n_7wgz_1980_40_008453366_2	77,760	106,927	1.3751
30 Sep 2013 21:15:30	1241630	16036074	hadcm3n_7wgz_1980_40_008453366_2	51,840	70,453	1.3590
30 Sep 2013 08:15:01	1241630	16036074	hadcm3n_7wgz_1980_40_008453366_2	25,920	35,488	1.3691