Task 16585546

Name	hadcm3n_88r0_1980_40_008720759_0
Workunit	8866737
Created	23 Apr 2014, 12:27:05 UTC
Sent	5 May 2014, 16:38:23 UTC
Report deadline	5 Aug 2014, 0:05:34 UTC
Received	31 May 2014, 6:34:01 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1241630
Run time	10 days 15 hours 7 min 25 sec
CPU time	8 days 21 hours 3 min 57 sec
Validate state	Invalid
Credit	6,842.88
Device peak FLOPS	3.13 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.2.42</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 02:05:01 (7328): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 02:07:32 (8860): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 08:53:59 (11148): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 20:14:26 (5060): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 20:14:27 (5060): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 10:36:17 (9920): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=13612, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 11 received, exiting... Called boinc_finish CPDN Monitor - Quit request from BOINC... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=14708, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=14708, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=16004, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish CPDN Monitor - Quit request from BOINC... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=13560, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish CPDN Monitor - Quit request from BOINC... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=17036, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=17008, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=17008, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
30 May 2014 11:17:35	1241630	16585546	hadcm3n_88r0_1980_40_008720759_0	570,240	752,475	1.3196
29 May 2014 21:49:39	1241630	16585546	hadcm3n_88r0_1980_40_008720759_0	544,320	719,334	1.3215
29 May 2014 10:51:37	1241630	16585546	hadcm3n_88r0_1980_40_008720759_0	518,400	684,995	1.3214
28 May 2014 22:50:42	1241630	16585546	hadcm3n_88r0_1980_40_008720759_0	492,480	651,032	1.3219
28 May 2014 11:38:21	1241630	16585546	hadcm3n_88r0_1980_40_008720759_0	466,560	616,178	1.3207
27 May 2014 23:34:38	1241630	16585546	hadcm3n_88r0_1980_40_008720759_0	440,640	582,090	1.3210
27 May 2014 12:26:50	1241630	16585546	hadcm3n_88r0_1980_40_008720759_0	414,720	547,376	1.3199
27 May 2014 01:59:51	1241630	16585546	hadcm3n_88r0_1980_40_008720759_0	388,800	513,047	1.3196
26 May 2014 13:54:33	1241630	16585546	hadcm3n_88r0_1980_40_008720759_0	362,880	478,666	1.3191
26 May 2014 01:26:42	1241630	16585546	hadcm3n_88r0_1980_40_008720759_0	336,960	444,663	1.3196
25 May 2014 14:23:03	1241630	16585546	hadcm3n_88r0_1980_40_008720759_0	311,040	410,440	1.3196
25 May 2014 03:45:35	1241630	16585546	hadcm3n_88r0_1980_40_008720759_0	285,120	376,025	1.3188
24 May 2014 16:16:50	1241630	16585546	hadcm3n_88r0_1980_40_008720759_0	259,200	341,943	1.3192
24 May 2014 05:00:46	1241630	16585546	hadcm3n_88r0_1980_40_008720759_0	233,280	307,797	1.3194
23 May 2014 16:41:54	1241630	16585546	hadcm3n_88r0_1980_40_008720759_0	207,360	273,762	1.3202
23 May 2014 05:29:46	1241630	16585546	hadcm3n_88r0_1980_40_008720759_0	181,440	239,634	1.3207
22 May 2014 17:06:23	1241630	16585546	hadcm3n_88r0_1980_40_008720759_0	155,520	205,698	1.3226
22 May 2014 06:54:42	1241630	16585546	hadcm3n_88r0_1980_40_008720759_0	129,600	171,102	1.3202
21 May 2014 18:09:05	1241630	16585546	hadcm3n_88r0_1980_40_008720759_0	103,680	137,195	1.3233
21 May 2014 08:15:58	1241630	16585546	hadcm3n_88r0_1980_40_008720759_0	77,760	102,614	1.3196