Task 15432608

Name	hadcm3n_zd58_1880_40_008241987_3
Workunit	8397111
Created	10 Nov 2012, 10:42:55 UTC
Sent	10 Nov 2012, 10:42:58 UTC
Report deadline	9 Feb 2013, 18:10:09 UTC
Received	3 Dec 2012, 10:45:11 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1222468
Run time	19 days 8 hours 19 min 45 sec
CPU time	18 days 1 hours 10 min 40 sec
Validate state	Invalid
Credit	7,153.92
Device peak FLOPS	1.79 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> El dispositivo no reconoce el comando. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2320, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3396, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 08:17:27 (2948): No heartbeat from core client for 30 sec - exiting 08:17:28 (2948): No heartbeat from core client for 30 sec - exiting 08:17:29 (2948): No heartbeat from core client for 30 sec - exiting 08:17:30 (2948): No heartbeat from core client for 30 sec - exiting 08:17:31 (2948): No heartbeat from core client for 30 sec - exiting 08:17:32 (2948): No heartbeat from core client for 30 sec - exiting 08:17:34 (2948): No heartbeat from core client for 30 sec - exiting 08:17:35 (2948): No heartbeat from core client for 30 sec - exiting 08:17:36 (2948): No heartbeat from core client for 30 sec - exiting 08:17:37 (2948): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1748, iMonCtr=1 Model crash detected, will try to restart... 11:48:08 (3788): No heartbeat from core client for 30 sec - exiting 11:48:10 (3788): No heartbeat from core client for 30 sec - exiting 11:48:11 (3788): No heartbeat from core client for 30 sec - exiting 11:48:12 (3788): No heartbeat from core client for 30 sec - exiting 11:48:13 (3788): No heartbeat from core client for 30 sec - exiting 11:48:14 (3788): No heartbeat from core client for 30 sec - exiting 11:48:15 (3788): No heartbeat from core client for 30 sec - exiting 11:48:16 (3788): No heartbeat from core client for 30 sec - exiting 11:48:17 (3788): No heartbeat from core client for 30 sec - exiting 11:48:18 (3788): No heartbeat from core client for 30 sec - exiting 11:48:19 (3788): No heartbeat from core client for 30 sec - exiting 11:48:20 (3788): No heartbeat from core client for 30 sec - exiting 11:48:22 (3788): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 10:41:37 (888): No heartbeat from core client for 30 sec - exiting 10:41:38 (888): No heartbeat from core client for 30 sec - exiting 10:41:39 (888): No heartbeat from core client for 30 sec - exiting 10:41:40 (888): No heartbeat from core client for 30 sec - exiting 10:41:42 (888): No heartbeat from core client for 30 sec - exiting 10:41:43 (888): No heartbeat from core client for 30 sec - exiting 10:41:44 (888): No heartbeat from core client for 30 sec - exiting 10:41:45 (888): No heartbeat from core client for 30 sec - exiting 10:41:46 (888): No heartbeat from core client for 30 sec - exiting 10:41:47 (888): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 09:13:55 (1972): No heartbeat from core client for 30 sec - exiting 09:13:56 (1972): No heartbeat from core client for 30 sec - exiting 09:13:57 (1972): No heartbeat from core client for 30 sec - exiting 09:13:58 (1972): No heartbeat from core client for 30 sec - exiting 09:13:59 (1972): No heartbeat from core client for 30 sec - exiting 09:14:01 (1972): No heartbeat from core client for 30 sec - exiting 09:14:02 (1972): No heartbeat from core client for 30 sec - exiting 09:14:03 (1972): No heartbeat from core client for 30 sec - exiting 09:14:04 (1972): No heartbeat from core client for 30 sec - exiting 09:14:05 (1972): No heartbeat from core client for 30 sec - exiting 09:14:06 (1972): No heartbeat from core client for 30 sec - exiting 09:14:07 (1972): No heartbeat from core client for 30 sec - exiting 09:14:08 (1972): No heartbeat from core client for 30 sec - exiting 09:14:09 (1972): No heartbeat from core client for 30 sec - exiting 09:14:10 (1972): No heartbeat from core client for 30 sec - exiting 09:14:11 (1972): No heartbeat from core client for 30 sec - exiting 09:14:13 (1972): No heartbeat from core client for 30 sec - exiting 09:14:14 (1972): No heartbeat from core client for 30 sec - exiting 09:14:15 (1972): No heartbeat from core client for 30 sec - exiting 09:14:16 (1972): No heartbeat from core client for 30 sec - exiting 09:14:17 (1972): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4568, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4568, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4568, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4568, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4568, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4568, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
01 Dec 2012 12:47:11	1222468	15432608	hadcm3n_zd58_1880_40_008241987_3	596,160	1,502,602	2.5205
30 Nov 2012 18:11:47	1222468	15432608	hadcm3n_zd58_1880_40_008241987_3	570,240	1,437,804	2.5214
29 Nov 2012 16:23:43	1222468	15432608	hadcm3n_zd58_1880_40_008241987_3	544,320	1,370,615	2.5180
28 Nov 2012 08:46:49	1222468	15432608	hadcm3n_zd58_1880_40_008241987_3	518,400	1,303,321	2.5141
27 Nov 2012 12:04:18	1222468	15432608	hadcm3n_zd58_1880_40_008241987_3	492,480	1,237,428	2.5126
26 Nov 2012 07:04:44	1222468	15432608	hadcm3n_zd58_1880_40_008241987_3	466,560	1,170,386	2.5085
25 Nov 2012 01:38:44	1222468	15432608	hadcm3n_zd58_1880_40_008241987_3	440,640	1,106,577	2.5113
24 Nov 2012 04:12:27	1222468	15432608	hadcm3n_zd58_1880_40_008241987_3	414,720	1,043,107	2.5152
23 Nov 2012 08:20:31	1222468	15432608	hadcm3n_zd58_1880_40_008241987_3	388,800	978,040	2.5155
22 Nov 2012 13:18:25	1222468	15432608	hadcm3n_zd58_1880_40_008241987_3	362,880	912,953	2.5159
21 Nov 2012 10:23:47	1222468	15432608	hadcm3n_zd58_1880_40_008241987_3	336,960	846,906	2.5134
20 Nov 2012 04:50:51	1222468	15432608	hadcm3n_zd58_1880_40_008241987_3	311,040	780,716	2.5100
19 Nov 2012 05:58:19	1222468	15432608	hadcm3n_zd58_1880_40_008241987_3	285,120	714,676	2.5066
18 Nov 2012 11:15:09	1222468	15432608	hadcm3n_zd58_1880_40_008241987_3	259,200	650,536	2.5098
17 Nov 2012 16:06:22	1222468	15432608	hadcm3n_zd58_1880_40_008241987_3	233,280	582,962	2.4990
16 Nov 2012 20:31:20	1222468	15432608	hadcm3n_zd58_1880_40_008241987_3	207,360	513,609	2.4769
15 Nov 2012 23:59:27	1222468	15432608	hadcm3n_zd58_1880_40_008241987_3	181,440	447,192	2.4647
15 Nov 2012 03:58:48	1222468	15432608	hadcm3n_zd58_1880_40_008241987_3	155,520	381,552	2.4534
14 Nov 2012 08:18:57	1222468	15432608	hadcm3n_zd58_1880_40_008241987_3	129,600	315,828	2.4369
13 Nov 2012 12:03:51	1222468	15432608	hadcm3n_zd58_1880_40_008241987_3	103,680	248,621	2.3980