Task 17459956

Name	hadcm3n_xbzc_1940_40_009151822_1
Workunit	9282158
Created	21 Nov 2014, 8:43:23 UTC
Sent	21 Nov 2014, 8:43:37 UTC
Report deadline	20 Feb 2015, 16:10:48 UTC
Received	5 Dec 2014, 4:24:38 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1346186
Run time	10 days 9 hours 42 min 3 sec
CPU time	9 days 8 hours 47 min 50 sec
Validate state	Invalid
Credit	11,819.52
Device peak FLOPS	3.22 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6216, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3912, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... CController:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3580, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=8572, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2876, iMonCtr=1 Model crash detected, will try to restart... 08:35:18 (8300): No heartbeat from core client for 30 sec - exiting 08:35:19 (8300): No heartbeat from core client for 30 sec - exiting 08:35:20 (8300): No heartbeat from core client for 30 sec - exiting 08:35:21 (8300): No heartbeat from core client for 30 sec - exiting 08:35:22 (8300): No heartbeat from core client for 30 sec - exiting 08:35:23 (8300): No heartbeat from core client for 30 sec - exiting 08:35:25 (8300): No heartbeat from core client for 30 sec - exiting 08:35:26 (8300): No heartbeat from core client for 30 sec - exiting 08:35:27 (8300): No heartbeat from core client for 30 sec - exiting 08:35:28 (8300): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Model crashed: P_TH_ADJ : NEGATIVE PRESSURE VALUE CREATED. tmp/pipe_dummy 2048 Model crashed: P_TH_ADJ : NEGATIVE PRESSURE VALUE CREATED. tmp/pipe_dummy 2048 Model crashed: P_TH_ADJ : NEGATIVE PRESSURE VALUE CREATED. tmp/pipe_dummy 2048 Model crashed: P_TH_ADJ : NEGATIVE PRESSURE VALUE CREATED. tmp/pipe_dummy 2048 Model crashed: P_TH_ADJ : NEGATIVE PRESSURE VALUE CREATED. tmp/pipe_dummy 2048 Model crashed: P_TH_ADJ : NEGATIVE PRESSURE VALUE CREATED. tmp/pipe_dummy 2048 Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
05 Dec 2014 02:27:35	1346186	17459956	hadcm3n_xbzc_1940_40_009151822_1	984,960	844,395	0.8573
04 Dec 2014 19:58:15	1346186	17459956	hadcm3n_xbzc_1940_40_009151822_1	959,040	821,264	0.8563
04 Dec 2014 10:51:46	1346186	17459956	hadcm3n_xbzc_1940_40_009151822_1	933,120	798,355	0.8556
04 Dec 2014 04:33:42	1346186	17459956	hadcm3n_xbzc_1940_40_009151822_1	907,200	775,644	0.8550
03 Dec 2014 11:23:25	1346186	17459956	hadcm3n_xbzc_1940_40_009151822_1	881,280	753,718	0.8553
03 Dec 2014 04:58:04	1346186	17459956	hadcm3n_xbzc_1940_40_009151822_1	855,360	730,710	0.8543
02 Dec 2014 11:16:38	1346186	17459956	hadcm3n_xbzc_1940_40_009151822_1	829,440	708,137	0.8538
02 Dec 2014 04:57:03	1346186	17459956	hadcm3n_xbzc_1940_40_009151822_1	803,520	685,897	0.8536
01 Dec 2014 22:11:58	1346186	17459956	hadcm3n_xbzc_1940_40_009151822_1	777,600	663,932	0.8538
01 Dec 2014 15:34:58	1346186	17459956	hadcm3n_xbzc_1940_40_009151822_1	751,680	641,294	0.8531
01 Dec 2014 03:15:00	1346186	17459956	hadcm3n_xbzc_1940_40_009151822_1	725,760	618,822	0.8527
30 Nov 2014 15:00:47	1346186	17459956	hadcm3n_xbzc_1940_40_009151822_1	699,840	596,496	0.8523
30 Nov 2014 06:14:46	1346186	17459956	hadcm3n_xbzc_1940_40_009151822_1	673,920	573,836	0.8515
30 Nov 2014 00:21:26	1346186	17459956	hadcm3n_xbzc_1940_40_009151822_1	648,000	551,910	0.8517
29 Nov 2014 17:13:43	1346186	17459956	hadcm3n_xbzc_1940_40_009151822_1	622,080	529,555	0.8513
29 Nov 2014 11:13:30	1346186	17459956	hadcm3n_xbzc_1940_40_009151822_1	596,160	507,009	0.8505
29 Nov 2014 03:51:25	1346186	17459956	hadcm3n_xbzc_1940_40_009151822_1	570,240	484,009	0.8488
28 Nov 2014 15:21:02	1346186	17459956	hadcm3n_xbzc_1940_40_009151822_1	544,320	463,885	0.8522
28 Nov 2014 08:45:50	1346186	17459956	hadcm3n_xbzc_1940_40_009151822_1	518,400	440,895	0.8505
28 Nov 2014 01:24:54	1346186	17459956	hadcm3n_xbzc_1940_40_009151822_1	492,480	417,905	0.8486