Task 13651817

Name	hadcm3n_ya42_1900_40_007527593_3
Workunit	7725068
Created	21 Nov 2011, 19:10:19 UTC
Sent	21 Nov 2011, 19:25:33 UTC
Report deadline	21 Feb 2012, 2:52:44 UTC
Received	30 Jan 2012, 19:11:56 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	193 (0x000000C1) EXIT_SIGNAL
Computer ID	1024386
Run time	18 days 16 hours 55 min 6 sec
CPU time	18 days 16 hours 48 min 40 sec
Validate state	Invalid
Credit	12,441.60
Device peak FLOPS	2.76 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.12.34</core_client_version> <![CDATA[ <message> - exit code 193 (0xc1) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3744, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3744, iMonCtr=1 Model crash detected, will try to restart... 21:06:35 (3744): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3608, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3676, iMonCtr=1 Model crash detected, will try to restart... 22:14:34 (3676): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 21:04:24 (3684): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 20:54:40 (3560): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 18:01:57 (3420): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3624, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3620, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 21:38:54 (2152): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3548, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Signal 11 received, exiting... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
29 Jan 2012 19:12:58	1024386	13651817	hadcm3n_ya42_1900_40_007527593_3	1,036,800	1,615,715	1.5584
27 Jan 2012 15:57:33	1024386	13651817	hadcm3n_ya42_1900_40_007527593_3	1,010,880	1,577,304	1.5603
23 Jan 2012 21:16:04	1024386	13651817	hadcm3n_ya42_1900_40_007527593_3	984,960	1,541,412	1.5649
22 Jan 2012 13:07:03	1024386	13651817	hadcm3n_ya42_1900_40_007527593_3	959,040	1,504,968	1.5692
17 Jan 2012 20:51:09	1024386	13651817	hadcm3n_ya42_1900_40_007527593_3	933,120	1,469,545	1.5749
16 Jan 2012 20:25:10	1024386	13651817	hadcm3n_ya42_1900_40_007527593_3	907,200	1,433,694	1.5804
15 Jan 2012 23:22:35	1024386	13651817	hadcm3n_ya42_1900_40_007527593_3	881,280	1,397,430	1.5857
15 Jan 2012 11:41:02	1024386	13651817	hadcm3n_ya42_1900_40_007527593_3	855,360	1,359,083	1.5889
15 Jan 2012 00:33:44	1024386	13651817	hadcm3n_ya42_1900_40_007527593_3	829,440	1,320,864	1.5925
14 Jan 2012 12:37:58	1024386	13651817	hadcm3n_ya42_1900_40_007527593_3	803,520	1,279,780	1.5927
14 Jan 2012 00:45:21	1024386	13651817	hadcm3n_ya42_1900_40_007527593_3	777,600	1,238,978	1.5933
13 Jan 2012 04:01:41	1024386	13651817	hadcm3n_ya42_1900_40_007527593_3	751,680	1,200,894	1.5976
12 Jan 2012 17:21:36	1024386	13651817	hadcm3n_ya42_1900_40_007527593_3	725,760	1,162,821	1.6022
11 Jan 2012 22:09:58	1024386	13651817	hadcm3n_ya42_1900_40_007527593_3	699,840	1,125,847	1.6087
11 Jan 2012 00:37:01	1024386	13651817	hadcm3n_ya42_1900_40_007527593_3	673,920	1,087,429	1.6136
09 Jan 2012 16:55:27	1024386	13651817	hadcm3n_ya42_1900_40_007527593_3	648,000	1,048,581	1.6182
07 Jan 2012 07:47:02	1024386	13651817	hadcm3n_ya42_1900_40_007527593_3	622,080	1,011,505	1.6260
06 Jan 2012 21:24:36	1024386	13651817	hadcm3n_ya42_1900_40_007527593_3	596,160	975,923	1.6370
04 Jan 2012 17:08:22	1024386	13651817	hadcm3n_ya42_1900_40_007527593_3	570,240	938,860	1.6464
03 Jan 2012 20:32:24	1024386	13651817	hadcm3n_ya42_1900_40_007527593_3	544,320	901,638	1.6564