Task 15900348

Name	hadcm3n_n4oy_1880_40_008401881_0
Workunit	8552737
Created	22 Jul 2013, 14:43:54 UTC
Sent	22 Jul 2013, 14:53:56 UTC
Report deadline	21 Oct 2013, 22:21:07 UTC
Received	14 Aug 2013, 16:05:16 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	-226 (0xFFFFFF1E) ERR_TOO_MANY_EXITS
Computer ID	1286261
Run time	13 days 9 hours 55 min 13 sec
CPU time	13 days 0 hours 48 min 14 sec
Validate state	Invalid
Credit	7,776.00
Device peak FLOPS	2.53 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.64</core_client_version> <![CDATA[ <message> too many exit(0)s </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 20:49:23 (6312): No heartbeat from core client for 30 sec - exiting 20:49:24 (6312): No heartbeat from core client for 30 sec - exiting 20:49:25 (6312): No heartbeat from core client for 30 sec - exiting 20:49:26 (6312): No heartbeat from core client for 30 sec - exiting 20:49:27 (6312): No heartbeat from core client for 30 sec - exiting 20:49:28 (6312): No heartbeat from core client for 30 sec - exiting 20:49:29 (6312): No heartbeat from core client for 30 sec - exiting 20:49:30 (6312): No heartbeat from core client for 30 sec - exiting 20:49:31 (6312): No heartbeat from core client for 30 sec - exiting 20:49:32 (6312): No heartbeat from core client for 30 sec - exiting 20:49:33 (6312): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1220, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... 21:46:22 (6252): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 22:10:46 (6588): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... BUFFIN: C I/O Error feof - Unit 63 - Return code = 16 BUFFIN: C I/O Error feof - Unit 64 - Return code = 16 BUFFIN: C I/O Error feof - Unit 65 - Return code = 16 BUFFIN: C I/O Error feof - Unit 66 - Return code = 16 BUFFIN: C I/O Error feof - Unit 67 - Return code = 16 BUFFIN: C I/O Error feof - Unit 68 - Return code = 16 BUFFIN: C I/O Error feof - Unit 69 - Return code = 16 Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITHEAD: I/O error BUFFOUT: C I/O Error - Return code = 32 forrtl: There is not enough space on the disk. Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=8896, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 18:46:29 (6428): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 20:30:57 (6308): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
14 Aug 2013 16:12:15	1286261	15900348	hadcm3n_n4oy_1880_40_008401881_0	648,000	1,097,384	1.6935
14 Aug 2013 16:12:15	1286261	15900348	hadcm3n_n4oy_1880_40_008401881_0	622,080	1,055,829	1.6973
14 Aug 2013 16:12:15	1286261	15900348	hadcm3n_n4oy_1880_40_008401881_0	596,160	1,012,111	1.6977
14 Aug 2013 16:12:15	1286261	15900348	hadcm3n_n4oy_1880_40_008401881_0	570,240	970,368	1.7017
14 Aug 2013 16:12:15	1286261	15900348	hadcm3n_n4oy_1880_40_008401881_0	544,320	925,796	1.7008
14 Aug 2013 16:12:15	1286261	15900348	hadcm3n_n4oy_1880_40_008401881_0	518,400	881,114	1.6997
14 Aug 2013 16:12:15	1286261	15900348	hadcm3n_n4oy_1880_40_008401881_0	492,480	836,620	1.6988
14 Aug 2013 16:12:15	1286261	15900348	hadcm3n_n4oy_1880_40_008401881_0	466,560	791,947	1.6974
14 Aug 2013 16:12:15	1286261	15900348	hadcm3n_n4oy_1880_40_008401881_0	440,640	744,589	1.6898
14 Aug 2013 16:12:15	1286261	15900348	hadcm3n_n4oy_1880_40_008401881_0	414,720	697,229	1.6812
14 Aug 2013 16:12:15	1286261	15900348	hadcm3n_n4oy_1880_40_008401881_0	388,800	652,488	1.6782
14 Aug 2013 16:12:15	1286261	15900348	hadcm3n_n4oy_1880_40_008401881_0	362,880	608,068	1.6757
14 Aug 2013 16:12:14	1286261	15900348	hadcm3n_n4oy_1880_40_008401881_0	336,960	563,646	1.6727
14 Aug 2013 16:12:14	1286261	15900348	hadcm3n_n4oy_1880_40_008401881_0	311,040	518,431	1.6668
14 Aug 2013 16:12:14	1286261	15900348	hadcm3n_n4oy_1880_40_008401881_0	285,120	470,329	1.6496
14 Aug 2013 16:12:14	1286261	15900348	hadcm3n_n4oy_1880_40_008401881_0	259,200	422,477	1.6299
14 Aug 2013 16:12:14	1286261	15900348	hadcm3n_n4oy_1880_40_008401881_0	233,280	377,776	1.6194
14 Aug 2013 16:12:14	1286261	15900348	hadcm3n_n4oy_1880_40_008401881_0	207,360	336,442	1.6225
14 Aug 2013 16:12:14	1286261	15900348	hadcm3n_n4oy_1880_40_008401881_0	181,440	294,717	1.6243
14 Aug 2013 16:12:14	1286261	15900348	hadcm3n_n4oy_1880_40_008401881_0	155,520	253,140	1.6277