Task 15489999

Name	hadcm3n_395o_1940_40_008261728_0
Workunit	8416852
Created	20 Dec 2012, 23:08:34 UTC
Sent	28 Dec 2012, 18:56:49 UTC
Report deadline	30 Mar 2013, 2:24:00 UTC
Received	29 Aug 2015, 19:03:58 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1252118
Run time	12 days 9 hours 20 min 14 sec
CPU time	11 days 10 hours 18 min 24 sec
Validate state	Invalid
Credit	8,709.12
Device peak FLOPS	2.74 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.6.6</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5228, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2700, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4908, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4552, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4088, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5720, iMonCtController:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5136, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5184, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... 13:01:37 (6408): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 14:26:23 (6752): No heartbeat from core client for 30 sec - exiting 14:26:24 (6752): No heartbeat from core client for 30 sec - exiting 14:26:25 (6752): No heartbeat from core client for 30 sec - exiting 14:26:26 (6752): No heartbeat from core client for 30 sec - exiting 14:26:27 (6752): No heartbeat from core client for 30 sec - exiting 14:26:28 (6752): No heartbeat from core client for 30 sec - exiting 14:26:29 (6752): No heartbeat from core client for 30 sec - exiting 14:26:30 (6752): No heartbeat from core client for 30 sec - exiting 14:26:31 (6752): No heartbeat from core client for 30 sec - exiting 14:26:32 (6752): No heartbeat from core client for 30 sec - exiting 14:26:33 (6752): No heartbeat from core client for 30 sec - exiting 14:26:34 (6752): No heartbeat from core client for 30 sec - exiting 14:26:35 (6752): No heartbeat from core client for 30 sec - exiting 14:26:36 (6752): No heartbeat from core client for 30 sec - exiting 14:26:37 (6752): No heartbeat from core client for 30 sec - exiting 14:26:38 (6752): No heartbeat from core client for 30 sec - exiting 14:26:39 (6752): No heartbeat from core client for 30 sec - exiting 14:26:40 (6752): No heartbeat from core client for 30 sec - exiting 14:26:41 (6752): No heartbeat from core client for 30 sec - exiting 14:26:42 (6752): No heartbeat from core client for 30 sec - exiting 14:26:43 (6752): No heartbeat from core client for 30 sec - exiting 14:26:44 (6752): No heartbeat from core client for 30 sec - exiting 14:26:45 (6752): No heartbeat from core client for 30 sec - exiting 14:26:46 (6752): No heartbeat from core client for 30 sec - exiting 14:26:47 (6752): No heartbeat from core client for 30 sec - exiting 14:26:48 (6752): No heartbeat from core client for 30 sec - exiting 14:26:49 (6752): No heartbeat from core client for 30 sec - exiting 14:26:50 (6752): No heartbeat from core client for 30 sec - exiting 14:26:51 (6752): No heartbeat from core client for 30 sec - exiting 14:26:52 (6752): No heartbeat from core client for 30 sec - exiting 14:26:53 (6752): No heartbeat from core client for 30 sec - exiting 14:26:54 (6752): No heartbeat from core client for 30 sec - exiting 14:26:55 (6752): No heartbeat from core client for 30 sec - exiting 14:26:56 (6752): No heartbeat from core client for 30 sec - exiting 14:26:57 (6752): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5160, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5160, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5056, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5056, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5056, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5056, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
11 May 2013 00:03:25	1252118	15489999	hadcm3n_395o_1940_40_008261728_0	725,760	971,091	1.3380
10 May 2013 13:03:06	1252118	15489999	hadcm3n_395o_1940_40_008261728_0	699,840	936,576	1.3383
10 May 2013 02:39:28	1252118	15489999	hadcm3n_395o_1940_40_008261728_0	673,920	901,370	1.3375
09 May 2013 16:52:02	1252118	15489999	hadcm3n_395o_1940_40_008261728_0	648,000	866,511	1.3372
09 May 2013 07:50:51	1252118	15489999	hadcm3n_395o_1940_40_008261728_0	622,080	832,852	1.3388
07 May 2013 13:07:44	1252118	15489999	hadcm3n_395o_1940_40_008261728_0	596,160	798,708	1.3398
07 May 2013 03:10:08	1252118	15489999	hadcm3n_395o_1940_40_008261728_0	570,240	763,440	1.3388
06 May 2013 17:30:35	1252118	15489999	hadcm3n_395o_1940_40_008261728_0	544,320	729,567	1.3403
06 May 2013 06:53:02	1252118	15489999	hadcm3n_395o_1940_40_008261728_0	518,400	694,272	1.3393
05 May 2013 20:23:47	1252118	15489999	hadcm3n_395o_1940_40_008261728_0	492,480	658,844	1.3378
05 May 2013 10:45:28	1252118	15489999	hadcm3n_395o_1940_40_008261728_0	466,560	624,064	1.3376
04 May 2013 18:21:20	1252118	15489999	hadcm3n_395o_1940_40_008261728_0	440,640	590,836	1.3409
04 May 2013 08:21:02	1252118	15489999	hadcm3n_395o_1940_40_008261728_0	414,720	555,502	1.3395
28 Apr 2013 12:57:25	1252118	15489999	hadcm3n_395o_1940_40_008261728_0	388,800	520,491	1.3387
28 Apr 2013 03:39:31	1252118	15489999	hadcm3n_395o_1940_40_008261728_0	362,880	485,529	1.3380
27 Apr 2013 16:52:26	1252118	15489999	hadcm3n_395o_1940_40_008261728_0	336,960	451,074	1.3387
15 Mar 2013 19:05:32	1252118	15489999	hadcm3n_395o_1940_40_008261728_0	311,040	416,274	1.3383
15 Mar 2013 08:18:22	1252118	15489999	hadcm3n_395o_1940_40_008261728_0	285,120	381,680	1.3387
05 Mar 2013 10:56:27	1252118	15489999	hadcm3n_395o_1940_40_008261728_0	259,200	347,716	1.3415
05 Mar 2013 01:18:46	1252118	15489999	hadcm3n_395o_1940_40_008261728_0	233,280	313,808	1.3452