Task 13542001

Name	hadcm3n_ye7c_1900_40_007518161_1
Workunit	7715636
Created	28 Oct 2011, 12:55:51 UTC
Sent	21 Nov 2011, 1:27:25 UTC
Report deadline	20 Feb 2012, 8:54:36 UTC
Received	20 Dec 2011, 23:16:36 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	193 (0x000000C1) EXIT_SIGNAL
Computer ID	1112451
Run time	9 days 5 hours 51 min 53 sec
CPU time	8 days 1 hours 11 min 50 sec
Validate state	Invalid
Credit	6,220.80
Device peak FLOPS	2.80 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.12.34</core_client_version> <![CDATA[ <message> - exit code 193 (0xc1) </message> <stderr_txt> Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4132, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4640, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... 07:21:41 (4796): No heartbeat from core client for 30 sec - exiting 07:21:42 (4796): No heartbeat from core client for 30 sec - exiting 07:21:43 (4796): No heartbeat from core client for 30 sec - exiting 07:21:44 (4796): No heartbeat from core client for 30 sec - exiting 07:21:45 (4796): No heartbeat from core client for 30 sec - exiting 07:21:47 (4796): No heartbeat from core client for 30 sec - exiting 07:21:48 (4796): No heartbeat from core client for 30 sec - exiting 07:21:49 (4796): No heartbeat from core client for 30 sec - exiting 07:21:50 (4796): No heartbeat from core client for 30 sec - exiting 07:21:51 (4796): No heartbeat from core client for 30 sec - exiting 07:21:52 (4796): No heartbeat from core client for 30 sec - exiting 07:21:53 (4796): No heartbeat from core client for 30 sec - exiting 07:21:54 (4796): No heartbeat from core client for 30 sec - exiting 07:21:55 (4796): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 17:25:10 (4284): No heartbeat from core client for 30 sec - exiting 17:25:11 (4284): No heartbeat from core client for 30 sec - exiting 17:25:12 (4284): No heartbeat from core client for 30 sec - exiting 17:25:14 (4284): No heartbeat from core client for 30 sec - exiting 17:25:15 (4284): No heartbeat from core client for 30 sec - exiting 17:25:16 (4284): No heartbeat from core client for 30 sec - exiting 17:25:17 (4284): No heartbeat from core client for 30 sec - exiting 17:25:18 (4284): No heartbeat from core client for 30 sec - exiting 17:25:19 (4284): No heartbeat from core client for 30 sec - exiting 17:25:20 (4284): No heartbeat from core client for 30 sec - exiting 17:25:21 (4284): No heartbeat from core client for 30 sec - exiting 17:25:22 (4284): No heartbeat from core client for 30 sec - exiting 17:25:23 (4284): No heartbeat from core client for 30 sec - exiting 17:25:24 (4284): No heartbeat from core client for 30 sec - exiting 17:25:26 (4284): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 17:33:34 (2604): No heartbeat from core client for 30 sec - exiting 17:33:35 (2604): No heartbeat from core client for 30 sec - exiting 17:33:36 (2604): No heartbeat from core client for 30 sec - exiting 17:33:37 (2604): No heartbeat from core client for 30 sec - exiting 17:33:38 (2604): No heartbeat from core client for 30 sec - exiting 17:33:39 (2604): No heartbeat from core client for 30 sec - exiting 17:33:40 (2604): No heartbeat from core client for 30 sec - exiting 17:33:41 (2604): No heartbeat from core client for 30 sec - exiting 17:33:42 (2604): No heartbeat from core client for 30 sec - exiting 17:33:43 (2604): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2224, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2916, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3644, iMonCtr=1 Model crash detected, will try to restart... 07:12:05 (2924): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4348, iMonCtr=1 Model crash detected, will try to restart... 17:08:24 (3148): No heartbeat from core client for 30 sec - exiting 17:08:25 (3148): No heartbeat from core client for 30 sec - exiting 17:08:26 (3148): No heartbeat from core client for 30 sec - exiting 17:08:27 (3148): No heartbeat from core client for 30 sec - exiting 17:08:28 (3148): No heartbeat from core client for 30 sec - exiting 17:08:29 (3148): No heartbeat from core client for 30 sec - exiting 17:08:30 (3148): No heartbeat from core client for 30 sec - exiting 17:08:31 (3148): No heartbeat from core client for 30 sec - exiting 17:08:32 (3148): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2432, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4376, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4872, iMonCtr=1 Model crash detected, will try to restart... 18:27:29 (5024): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 18:27:29 (1588): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 03:54:40 (2404): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 19:12:37 (4312): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Unhandled Exception Detected... - Unhandled Exception Record - Reason: Access Violation (0xc0000005) at address 0x77B23A93 read attempt to address 0x00000000 Engaging BOINC Windows Runtime Debugger... Unhandled Exception Detected... - Unhandled Exception Record - Reason: Access Violation (0xc0000005) at address 0x77723A93 read attempt to address 0x00000000 Engaging BOINC Windows Runtime Debugger... Cannot serialize file C:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_ye7c_1900_40_007518161/dataout/shmem_restart.day Signal 11 received, exiting... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
20 Dec 2011 15:30:55	1112451	13542001	hadcm3n_ye7c_1900_40_007518161_1	518,400	691,665	1.3342
19 Dec 2011 02:26:15	1112451	13542001	hadcm3n_ye7c_1900_40_007518161_1	492,480	656,783	1.3336
17 Dec 2011 03:52:43	1112451	13542001	hadcm3n_ye7c_1900_40_007518161_1	466,560	622,121	1.3334
17 Dec 2011 01:17:00	1112451	13542001	hadcm3n_ye7c_1900_40_007518161_1	440,640	586,171	1.3303
17 Dec 2011 01:17:00	1112451	13542001	hadcm3n_ye7c_1900_40_007518161_1	414,720	551,683	1.3303
13 Dec 2011 13:57:51	1112451	13542001	hadcm3n_ye7c_1900_40_007518161_1	388,800	517,075	1.3299
13 Dec 2011 13:57:51	1112451	13542001	hadcm3n_ye7c_1900_40_007518161_1	362,880	483,687	1.3329
11 Dec 2011 15:03:22	1112451	13542001	hadcm3n_ye7c_1900_40_007518161_1	336,960	449,615	1.3343
10 Dec 2011 13:42:08	1112451	13542001	hadcm3n_ye7c_1900_40_007518161_1	311,040	415,774	1.3367
10 Dec 2011 13:42:08	1112451	13542001	hadcm3n_ye7c_1900_40_007518161_1	285,120	382,009	1.3398
09 Dec 2011 03:56:31	1112451	13542001	hadcm3n_ye7c_1900_40_007518161_1	259,200	347,980	1.3425
08 Dec 2011 14:44:39	1112451	13542001	hadcm3n_ye7c_1900_40_007518161_1	233,280	313,442	1.3436
04 Dec 2011 07:44:42	1112451	13542001	hadcm3n_ye7c_1900_40_007518161_1	207,360	278,747	1.3443
02 Dec 2011 15:08:38	1112451	13542001	hadcm3n_ye7c_1900_40_007518161_1	181,440	243,789	1.3436
02 Dec 2011 15:08:38	1112451	13542001	hadcm3n_ye7c_1900_40_007518161_1	155,520	209,343	1.3461
02 Dec 2011 15:08:38	1112451	13542001	hadcm3n_ye7c_1900_40_007518161_1	129,600	174,453	1.3461
27 Nov 2011 15:07:22	1112451	13542001	hadcm3n_ye7c_1900_40_007518161_1	103,680	139,250	1.3431
27 Nov 2011 15:07:22	1112451	13542001	hadcm3n_ye7c_1900_40_007518161_1	77,760	104,093	1.3386
26 Nov 2011 23:48:00	1112451	13542001	hadcm3n_ye7c_1900_40_007518161_1	51,840	69,376	1.3383
26 Nov 2011 23:48:00	1112451	13542001	hadcm3n_ye7c_1900_40_007518161_1	25,920	34,549	1.3329