Task 15560972

Name	hadcm3n_y8eg_1980_40_008242916_4
Workunit	8398040
Created	30 Jan 2013, 3:24:33 UTC
Sent	30 Jan 2013, 3:25:02 UTC
Report deadline	1 May 2013, 10:52:13 UTC
Received	8 Apr 2013, 15:29:21 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1266669
Run time	15 days 18 hours 6 min 31 sec
CPU time	15 days 6 hours 5 min 44 sec
Validate state	Invalid
Credit	8,398.08
Device peak FLOPS	2.55 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 11:25:57 (2288): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 17:58:48 (2620): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 21:48:21 (2536): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3616, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 23:46:46 (2516): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 09:49:18 (2472): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 10:01:48 (4028): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - No 'heartbeat' from BOINC... 19:53:17 (3452): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2548, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2548, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2548, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2548, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2548, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2548, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
07 Apr 2013 19:55:50	1266669	15560972	hadcm3n_y8eg_1980_40_008242916_4	699,840	1,300,801	1.8587
06 Apr 2013 17:20:01	1266669	15560972	hadcm3n_y8eg_1980_40_008242916_4	673,920	1,251,674	1.8573
02 Apr 2013 02:46:23	1266669	15560972	hadcm3n_y8eg_1980_40_008242916_4	648,000	1,201,903	1.8548
30 Mar 2013 23:31:33	1266669	15560972	hadcm3n_y8eg_1980_40_008242916_4	622,080	1,153,713	1.8546
29 Mar 2013 23:11:07	1266669	15560972	hadcm3n_y8eg_1980_40_008242916_4	596,160	1,105,608	1.8545
28 Mar 2013 02:56:42	1266669	15560972	hadcm3n_y8eg_1980_40_008242916_4	570,240	1,056,300	1.8524
23 Mar 2013 19:01:13	1266669	15560972	hadcm3n_y8eg_1980_40_008242916_4	544,320	1,006,588	1.8493
21 Mar 2013 22:25:24	1266669	15560972	hadcm3n_y8eg_1980_40_008242916_4	518,400	957,738	1.8475
21 Mar 2013 08:29:05	1266669	15560972	hadcm3n_y8eg_1980_40_008242916_4	492,480	909,029	1.8458
19 Mar 2013 11:09:40	1266669	15560972	hadcm3n_y8eg_1980_40_008242916_4	466,560	860,460	1.8443
18 Mar 2013 00:01:21	1266669	15560972	hadcm3n_y8eg_1980_40_008242916_4	440,640	811,330	1.8413
16 Mar 2013 22:21:21	1266669	15560972	hadcm3n_y8eg_1980_40_008242916_4	414,720	762,566	1.8387
14 Mar 2013 00:02:14	1266669	15560972	hadcm3n_y8eg_1980_40_008242916_4	388,800	713,144	1.8342
10 Mar 2013 21:13:31	1266669	15560972	hadcm3n_y8eg_1980_40_008242916_4	362,880	664,585	1.8314
09 Mar 2013 21:33:11	1266669	15560972	hadcm3n_y8eg_1980_40_008242916_4	336,960	616,095	1.8284
07 Mar 2013 01:07:33	1266669	15560972	hadcm3n_y8eg_1980_40_008242916_4	311,040	568,213	1.8268
04 Mar 2013 03:16:56	1266669	15560972	hadcm3n_y8eg_1980_40_008242916_4	285,120	527,689	1.8508
20 Feb 2013 02:06:45	1266669	15560972	hadcm3n_y8eg_1980_40_008242916_4	259,200	479,240	1.8489
17 Feb 2013 22:15:45	1266669	15560972	hadcm3n_y8eg_1980_40_008242916_4	233,280	430,572	1.8457
16 Feb 2013 19:00:48	1266669	15560972	hadcm3n_y8eg_1980_40_008242916_4	207,360	382,307	1.8437