Task 14619506

Name	hadcm3n_ymkw_1980_40_007955434_0
Workunit	8110546
Created	2 May 2012, 14:53:02 UTC
Sent	2 May 2012, 15:10:19 UTC
Report deadline	1 Aug 2012, 22:37:30 UTC
Received	23 Jun 2012, 16:28:55 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1185682
Run time	45 days 20 hours 18 min 29 sec
CPU time	42 days 19 hours 26 min 32 sec
Validate state	Invalid
Credit	9,953.28
Device peak FLOPS	1.34 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.12.34</core_client_version> <![CDATA[ <message> El dispositivo no reconoce el comando. (0x16) - exit code 22 (0x16) </message> <stderr_txt> 21:03:39 (4948): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 23:08:42 (2308): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 15:10:30 (5184): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 15:10:31 (5184): No heartbeat from core client for 30 sec - exiting 06:49:45 (3776): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 08:51:31 (720): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 08:51:32 (720): No heartbeat from core client for 30 sec - exiting 11:37:25 (4212): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 11:39:55 (5512): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 15:28:43 (3092): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 15:28:44 (3092): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 12:36:37 (1312): No heartbeat from core client for 30 sec - exiting 12:36:39 (1312): No heartbeat from core client for 30 sec - exiting 12:36:40 (1312): No heartbeat from core client for 30 sec - exiting 12:36:41 (1312): No heartbeat from core client for 30 sec - exiting 12:36:42 (1312): No heartbeat from core client for 30 sec - exiting 12:36:43 (1312): No heartbeat from core client for 30 sec - exiting 12:36:44 (1312): No heartbeat from core client for 30 sec - exiting 12:36:45 (1312): No heartbeat from core client for 30 sec - exiting 12:36:46 (1312): No heartbeat from core client for 30 sec - exiting 12:36:47 (1312): No heartbeat from core client for 30 sec - exiting 12:36:48 (1312): No heartbeat from core client for 30 sec - exiting 12:36:49 (1312): No heartbeat from core client for 30 sec - exiting 12:36:51 (1312): No heartbeat from core client for 30 sec - exiting 12:36:52 (1312): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 05:38:28 (1328): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 11:43:27 (2836): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 14:30:14 (1140): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 15:26:04 (2796): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 15:26:05 (2796): No heartbeat from core client for 30 sec - exiting 15:26:06 (2796): No heartbeat from core client for 30 sec - exiting 19:32:12 (1676): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 07:35:25 (1280): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 07:35:26 (1280): No heartbeat from core client for 30 sec - exiting 11:36:06 (2520): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 15:37:26 (3912): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 16:05:24 (1720): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 23:39:00 (3312): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 03:37:23 (3192): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 15:27:56 (3216): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 15:27:57 (3216): No heartbeat from core client for 30 sec - exiting 10:18:44 (1676): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 13:27:58 (3660): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 13:28:00 (3660): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 14:09:52 (1148): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 14:09:53 (1148): No heartbeat from core client for 30 sec - exiting 14:09:54 (1148): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 09:09:59 (2964): No heartbeat from core client for 30 sec - exiting 09:10:01 (2964): No heartbeat from core client for 30 sec - exiting 09:10:02 (2964): No heartbeat from core client for 30 sec - exiting 09:10:03 (2964): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 16:16:18 (3700): No heartbeat from core client for 30 sec - exiting 16:16:19 (3700): No heartbeat from core client for 30 sec - exiting 16:16:20 (3700): No heartbeat from core client for 30 sec - exiting 16:16:21 (3700): No heartbeat from core client for 30 sec - exiting 16:16:23 (3700): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2056, iMonCtr=1 Model crash detected, will try to restart... forrtl: La operación solicitada no se puede realizar en un archivo con una sección asignada a usuario abierta. Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2056, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 18:24:52 (3628): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3156, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3156, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3156, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3156, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3156, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3156, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
21 Jun 2012 10:38:13	1185682	14619506	hadcm3n_ymkw_1980_40_007955434_0	829,440	3,582,243	4.3189
20 Jun 2012 02:57:49	1185682	14619506	hadcm3n_ymkw_1980_40_007955434_0	803,520	3,473,853	4.3233
18 Jun 2012 10:31:08	1185682	14619506	hadcm3n_ymkw_1980_40_007955434_0	777,600	3,334,658	4.2884
15 Jun 2012 16:37:37	1185682	14619506	hadcm3n_ymkw_1980_40_007955434_0	751,680	3,323,983	4.4221
13 Jun 2012 06:18:38	1185682	14619506	hadcm3n_ymkw_1980_40_007955434_0	725,760	3,192,510	4.3989
11 Jun 2012 00:47:49	1185682	14619506	hadcm3n_ymkw_1980_40_007955434_0	699,840	3,065,853	4.3808
09 Jun 2012 23:43:01	1185682	14619506	hadcm3n_ymkw_1980_40_007955434_0	673,920	2,979,095	4.4205
08 Jun 2012 00:24:29	1185682	14619506	hadcm3n_ymkw_1980_40_007955434_0	648,000	2,874,828	4.4365
06 Jun 2012 12:25:55	1185682	14619506	hadcm3n_ymkw_1980_40_007955434_0	622,080	2,750,583	4.4216
04 Jun 2012 22:33:03	1185682	14619506	hadcm3n_ymkw_1980_40_007955434_0	596,160	2,620,388	4.3954
03 Jun 2012 15:46:41	1185682	14619506	hadcm3n_ymkw_1980_40_007955434_0	570,240	2,515,587	4.4115
02 Jun 2012 14:36:06	1185682	14619506	hadcm3n_ymkw_1980_40_007955434_0	544,320	2,428,307	4.4612
01 Jun 2012 13:34:38	1185682	14619506	hadcm3n_ymkw_1980_40_007955434_0	518,400	2,341,673	4.5171
31 May 2012 00:34:00	1185682	14619506	hadcm3n_ymkw_1980_40_007955434_0	492,480	2,213,671	4.4949
29 May 2012 14:43:05	1185682	14619506	hadcm3n_ymkw_1980_40_007955434_0	466,560	2,110,580	4.5237
27 May 2012 21:37:14	1185682	14619506	hadcm3n_ymkw_1980_40_007955434_0	440,640	1,985,220	4.5053
26 May 2012 06:17:14	1185682	14619506	hadcm3n_ymkw_1980_40_007955434_0	414,720	1,848,945	4.4583
24 May 2012 17:03:00	1185682	14619506	hadcm3n_ymkw_1980_40_007955434_0	388,800	1,719,950	4.4237
23 May 2012 04:21:35	1185682	14619506	hadcm3n_ymkw_1980_40_007955434_0	362,880	1,593,648	4.3917
21 May 2012 15:54:48	1185682	14619506	hadcm3n_ymkw_1980_40_007955434_0	336,960	1,468,129	4.3570