Task 16048584

Name	hadcm3n_ofro_1900_40_008475559_1
Workunit	8626398
Created	28 Sep 2013, 20:58:04 UTC
Sent	28 Sep 2013, 21:32:14 UTC
Report deadline	29 Dec 2013, 4:59:25 UTC
Received	15 Dec 2013, 21:59:16 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1293294
Run time	9 days 5 hours 46 min 41 sec
CPU time	8 days 20 hours 45 min 25 sec
Validate state	Invalid
Credit	8,087.04
Device peak FLOPS	3.60 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.64</core_client_version> <![CDATA[ <message> El dispositivo no reconoce el comando. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 15:23:16 (6160): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 07:29:30 (6852): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 08:00:26 (5996): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 07:52:30 (5564): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 15:49:20 (4668): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 07:50:22 (4076): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 07:38:05 (1468): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 11:47:22 (6528): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 14:14:29 (5752): No heartbeat from core client for 30 sec - exiting 14:14:30 (5752): No heartbeat from core client for 30 sec - exiting 14:14:31 (5752): No heartbeat from core client for 30 sec - exiting 14:14:32 (5752): No heartbeat from core client for 30 sec - exiting 14:14:33 (5752): No heartbeat from core client for 30 sec - exiting 14:14:34 (5752): No heartbeat from core client for 30 sec - exiting 14:14:35 (5752): No heartbeat from core client for 30 sec - exiting 14:14:36 (5752): No heartbeat from core client for 30 sec - exiting 14:14:37 (5752): No heartbeat from core client for 30 sec - exiting 14:14:38 (5752): No heartbeat from core client for 30 sec - exiting 14:14:39 (5752): No heartbeat from core client for 30 sec - exiting 14:14:40 (5752): No heartbeat from core client for 30 sec - exiting 14:14:41 (5752): No heartbeat from core client for 30 sec - exiting 14:14:42 (5752): No heartbeat from core client for 30 sec - exiting 14:14:43 (5752): No heartbeat from core client for 30 sec - exiting 14:14:44 (5752): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5584, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6220, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6220, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6220, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6220, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6220, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6220, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
12 Nov 2013 21:53:41	1293294	16048584	hadcm3n_ofro_1900_40_008475559_1	673,920	751,229	1.1147
13 Oct 2013 05:23:05	1293294	16048584	hadcm3n_ofro_1900_40_008475559_1	648,000	723,263	1.1161
12 Oct 2013 21:09:22	1293294	16048584	hadcm3n_ofro_1900_40_008475559_1	622,080	695,960	1.1188
12 Oct 2013 12:54:27	1293294	16048584	hadcm3n_ofro_1900_40_008475559_1	596,160	667,647	1.1199
12 Oct 2013 04:28:22	1293294	16048584	hadcm3n_ofro_1900_40_008475559_1	570,240	639,948	1.1222
11 Oct 2013 20:13:33	1293294	16048584	hadcm3n_ofro_1900_40_008475559_1	544,320	612,515	1.1253
11 Oct 2013 11:39:24	1293294	16048584	hadcm3n_ofro_1900_40_008475559_1	518,400	585,722	1.1299
11 Oct 2013 03:37:32	1293294	16048584	hadcm3n_ofro_1900_40_008475559_1	492,480	559,344	1.1358
10 Oct 2013 18:22:56	1293294	16048584	hadcm3n_ofro_1900_40_008475559_1	466,560	532,007	1.1403
10 Oct 2013 04:13:52	1293294	16048584	hadcm3n_ofro_1900_40_008475559_1	440,640	501,849	1.1389
09 Oct 2013 19:48:24	1293294	16048584	hadcm3n_ofro_1900_40_008475559_1	414,720	472,257	1.1387
07 Oct 2013 10:26:29	1293294	16048584	hadcm3n_ofro_1900_40_008475559_1	388,800	441,787	1.1363
07 Oct 2013 02:10:37	1293294	16048584	hadcm3n_ofro_1900_40_008475559_1	362,880	412,317	1.1362
06 Oct 2013 17:59:36	1293294	16048584	hadcm3n_ofro_1900_40_008475559_1	336,960	382,953	1.1365
06 Oct 2013 09:45:28	1293294	16048584	hadcm3n_ofro_1900_40_008475559_1	311,040	353,599	1.1368
06 Oct 2013 01:25:45	1293294	16048584	hadcm3n_ofro_1900_40_008475559_1	285,120	324,194	1.1370
05 Oct 2013 17:11:20	1293294	16048584	hadcm3n_ofro_1900_40_008475559_1	259,200	294,821	1.1374
05 Oct 2013 08:53:55	1293294	16048584	hadcm3n_ofro_1900_40_008475559_1	233,280	265,429	1.1378
05 Oct 2013 01:40:57	1293294	16048584	hadcm3n_ofro_1900_40_008475559_1	207,360	236,188	1.1390
03 Oct 2013 08:05:47	1293294	16048584	hadcm3n_ofro_1900_40_008475559_1	181,440	205,397	1.1320