Task 13610357

Name	hadcm3n_u2ee_1980_40_007539906_1
Workunit	7737138
Created	6 Nov 2011, 4:23:10 UTC
Sent	6 Nov 2011, 16:01:31 UTC
Report deadline	5 Feb 2012, 23:28:42 UTC
Received	24 Dec 2011, 10:13:41 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	193 (0x000000C1) EXIT_SIGNAL
Computer ID	1121922
Run time	31 days 0 hours 36 min 25 sec
CPU time	24 days 0 hours 22 min 57 sec
Validate state	Invalid
Credit	6,842.88
Device peak FLOPS	1.48 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 i686-pc-linux-gnu
Stderr	<core_client_version>6.12.33</core_client_version> <![CDATA[ <message> process exited with code 193 (0xc1, -63) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1482, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1479, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1517, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1474, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1474, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 06:21:39 (1457): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 18:12:19 (1472): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1484, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1487, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1474, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1489, iMonCtr=1 Model crash detected, will try to restart... 20:05:12 (1489): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1517, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1480, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 3 received, exiting... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
22 Dec 2011 19:57:00	1121922	13610357	hadcm3n_u2ee_1980_40_007539906_1	570,240	2,030,791	3.5613
20 Dec 2011 12:30:12	1121922	13610357	hadcm3n_u2ee_1980_40_007539906_1	544,320	1,948,564	3.5798
18 Dec 2011 16:54:10	1121922	13610357	hadcm3n_u2ee_1980_40_007539906_1	518,400	1,881,642	3.6297
17 Dec 2011 03:42:40	1121922	13610357	hadcm3n_u2ee_1980_40_007539906_1	492,480	1,784,756	3.6240
15 Dec 2011 06:38:47	1121922	13610357	hadcm3n_u2ee_1980_40_007539906_1	466,560	1,691,941	3.6264
13 Dec 2011 10:37:02	1121922	13610357	hadcm3n_u2ee_1980_40_007539906_1	440,640	1,596,433	3.6230
10 Dec 2011 15:02:28	1121922	13610357	hadcm3n_u2ee_1980_40_007539906_1	414,720	1,499,252	3.6151
08 Dec 2011 20:19:15	1121922	13610357	hadcm3n_u2ee_1980_40_007539906_1	388,800	1,402,510	3.6073
06 Dec 2011 14:41:44	1121922	13610357	hadcm3n_u2ee_1980_40_007539906_1	362,880	1,304,572	3.5951
04 Dec 2011 12:15:46	1121922	13610357	hadcm3n_u2ee_1980_40_007539906_1	336,960	1,207,305	3.5829
02 Dec 2011 16:29:01	1121922	13610357	hadcm3n_u2ee_1980_40_007539906_1	311,040	1,109,073	3.5657
30 Nov 2011 21:21:26	1121922	13610357	hadcm3n_u2ee_1980_40_007539906_1	285,120	1,026,427	3.6000
28 Nov 2011 01:08:18	1121922	13610357	hadcm3n_u2ee_1980_40_007539906_1	259,200	930,313	3.5892
26 Nov 2011 12:15:27	1121922	13610357	hadcm3n_u2ee_1980_40_007539906_1	233,280	835,368	3.5810
24 Nov 2011 02:39:59	1121922	13610357	hadcm3n_u2ee_1980_40_007539906_1	207,360	738,957	3.5636
21 Nov 2011 19:14:17	1121922	13610357	hadcm3n_u2ee_1980_40_007539906_1	181,440	642,327	3.5402
19 Nov 2011 22:55:29	1121922	13610357	hadcm3n_u2ee_1980_40_007539906_1	155,520	545,064	3.5048
18 Nov 2011 01:52:21	1121922	13610357	hadcm3n_u2ee_1980_40_007539906_1	129,600	448,557	3.4611
15 Nov 2011 20:43:35	1121922	13610357	hadcm3n_u2ee_1980_40_007539906_1	103,680	352,579	3.4006
15 Nov 2011 20:43:35	1121922	13610357	hadcm3n_u2ee_1980_40_007539906_1	77,760	253,764	3.2634