Task 13557901

Name	hadcm3n_yevx_1900_40_007526073_0
Workunit	7723548
Created	28 Oct 2011, 13:44:06 UTC
Sent	29 Oct 2011, 19:53:52 UTC
Report deadline	29 Jan 2012, 3:21:03 UTC
Received	29 Dec 2011, 23:52:04 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	193 (0x000000C1) EXIT_SIGNAL
Computer ID	998289
Run time	21 days 22 hours 59 min 46 sec
CPU time	17 days 3 hours 45 min 17 sec
Validate state	Invalid
Credit	6,220.80
Device peak FLOPS	1.22 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.58</core_client_version> <![CDATA[ <message> - exit code 193 (0xc1) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... BUFFIN: C I/O Error feof - Unit 63 - Return code = 16 BUFFIN: C I/O Error feof - Unit 64 - Return code = 16 BUFFIN: C I/O Error feof - Unit 65 - Return code = 16 BUFFIN: C I/O Error feof - Unit 66 - Return code = 16 BUFFIN: C I/O Error feof - Unit 67 - Return code = 16 BUFFIN: C I/O Error feof - Unit 68 - Return code = 16 BUFFIN: C I/O Error feof - Unit 69 - Return code = 16 Error converting file to netcdf: dataout/yevxko.pja2c10 Error converting file to netcdf: dataout/yevxko.pia2c10 Error converting file to netcdf: dataout/yevxko.pfa2c10 Error converting file to netcdf: dataout/yevxka.pha2c10 Error converting file to netcdf: dataout/yevxka.pga2c10 Error converting file to netcdf: dataout/yevxka.pea2c10 Error converting file to netcdf: dataout/yevxka.pda2c10 CPDN Monitor - Quit request from BOINC... BUFFIN: C I/O Error feof - Unit 63 - Return code = 16 BUFFIN: C I/O Error feof - Unit 64 - Return code = 16 BUFFIN: C I/O Error feof - Unit 65 - Return code = 16 BUFFIN: C I/O Error feof - Unit 66 - Return code = 16 BUFFIN: C I/O Error feof - Unit 67 - Return code = 16 BUFFIN: C I/O Error feof - Unit 68 - Return code = 16 BUFFIN: C I/O Error feof - Unit 69 - Return code = 16 CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5512, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6840, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Ocean Restart file copy failed on yevxko.dab0c20 CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1084, iMonCtr=1 Model crash detected, will try to restart... 10:14:21 (1084): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=9048, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 05:21:12 (9032): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 03:01:15 (8516): No heartbeat from core client for 30 sec - exiting 03:01:32 (8516): No heartbeat from core client for 30 sec - exiting 03:01:33 (8516): No heartbeat from core client for 30 sec - exiting 03:01:34 (8516): No heartbeat from core client for 30 sec - exiting 03:01:36 (8516): No heartbeat from core client for 30 sec - exiting 03:01:37 (8516): No heartbeat from core client for 30 sec - exiting 03:01:38 (8516): No heartbeat from core client for 30 sec - exiting 03:01:39 (8516): No heartbeat from core client for 30 sec - exiting 03:01:40 (8516): No heartbeat from core client for 30 sec - exiting 03:01:41 (8516): No heartbeat from core client for 30 sec - exiting 03:01:42 (8516): No heartbeat from core client for 30 sec - exiting 03:01:43 (8516): No heartbeat from core client for 30 sec - exiting 03:01:44 (8516): No heartbeat from core client for 30 sec - exiting 03:01:45 (8516): No heartbeat from core client for 30 sec - exiting 03:01:47 (8516): No heartbeat from core client for 30 sec - exiting 03:01:48 (8516): No heartbeat from core client for 30 sec - exiting 03:01:49 (8516): No heartbeat from core client for 30 sec - exiting 03:01:50 (8516): No heartbeat from core client for 30 sec - exiting 03:01:51 (8516): No heartbeat from core client for 30 sec - exiting 03:01:52 (8516): No heartbeat from core client for 30 sec - exiting 03:01:53 (8516): No heartbeat from core client for 30 sec - exiting 03:01:54 (8516): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Unhandled Exception Detected... - Unhandled Exception Record - Reason: Access Violation (0xc0000005) at address 0x7711361F read attempt to address 0xFFFFFFF8 Engaging BOINC Windows Runtime Debugger... Cannot serialize file C:\ProgramData\BOINC/projects/climateprediction.net/hadcm3n_yevx_1900_40_007526073/dataout/shmem_restart.day Signal 11 received, exiting... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
29 Dec 2011 20:05:10	998289	13557901	hadcm3n_yevx_1900_40_007526073_0	518,400	1,482,302	2.8594
27 Dec 2011 21:41:59	998289	13557901	hadcm3n_yevx_1900_40_007526073_0	492,480	1,390,237	2.8229
25 Dec 2011 22:17:59	998289	13557901	hadcm3n_yevx_1900_40_007526073_0	466,560	1,305,138	2.7974
22 Dec 2011 20:37:27	998289	13557901	hadcm3n_yevx_1900_40_007526073_0	440,640	1,211,637	2.7497
15 Dec 2011 02:02:33	998289	13557901	hadcm3n_yevx_1900_40_007526073_0	414,720	1,113,354	2.6846
09 Dec 2011 02:56:16	998289	13557901	hadcm3n_yevx_1900_40_007526073_0	388,800	1,055,308	2.7143
05 Dec 2011 21:45:53	998289	13557901	hadcm3n_yevx_1900_40_007526073_0	362,880	994,164	2.7396
04 Dec 2011 04:28:55	998289	13557901	hadcm3n_yevx_1900_40_007526073_0	336,960	929,991	2.7599
21 Nov 2011 07:38:09	998289	13557901	hadcm3n_yevx_1900_40_007526073_0	311,040	870,291	2.7980
20 Nov 2011 01:01:06	998289	13557901	hadcm3n_yevx_1900_40_007526073_0	285,120	818,075	2.8692
19 Nov 2011 00:31:30	998289	13557901	hadcm3n_yevx_1900_40_007526073_0	259,200	751,891	2.9008
18 Nov 2011 01:17:12	998289	13557901	hadcm3n_yevx_1900_40_007526073_0	233,280	674,983	2.8934
16 Nov 2011 22:40:40	998289	13557901	hadcm3n_yevx_1900_40_007526073_0	207,360	604,972	2.9175
16 Nov 2011 03:42:33	998289	13557901	hadcm3n_yevx_1900_40_007526073_0	181,440	539,589	2.9739
15 Nov 2011 18:24:36	998289	13557901	hadcm3n_yevx_1900_40_007526073_0	155,520	471,483	3.0317
15 Nov 2011 18:24:36	998289	13557901	hadcm3n_yevx_1900_40_007526073_0	129,600	396,716	3.0611
15 Nov 2011 18:24:36	998289	13557901	hadcm3n_yevx_1900_40_007526073_0	103,680	314,895	3.0372
02 Nov 2011 14:28:11	998289	13557901	hadcm3n_yevx_1900_40_007526073_0	77,760	232,103	2.9849
01 Nov 2011 03:35:02	998289	13557901	hadcm3n_yevx_1900_40_007526073_0	51,840	166,600	3.2137
31 Oct 2011 19:21:41	998289	13557901	hadcm3n_yevx_1900_40_007526073_0	25,920	83,152	3.2080