Task 15855025

Name	hadcm3n_n6q1_1920_40_008393405_0
Workunit	8544264
Created	21 Jun 2013, 22:15:28 UTC
Sent	23 Jun 2013, 18:02:55 UTC
Report deadline	23 Sep 2013, 1:30:06 UTC
Received	20 Jul 2013, 16:56:03 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1289096
Run time	16 days 17 hours 20 min 22 sec
CPU time	15 days 9 hours 56 min 4 sec
Validate state	Invalid
Credit	7,776.00
Device peak FLOPS	3.33 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 i686-apple-darwin
Stderr	<core_client_version>7.0.65</core_client_version> <![CDATA[ <message> process exited with code 22 (0x16, -234) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 17:38:51 (60784): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 18:45:34 (40052): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 19:06:02 (59190): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 20:05:54 (59423): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 20:06:39 (59882): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 20:07:53 (59892): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 20:09:31 (59916): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 21:16:03 (59934): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 22:15:54 (60373): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 23:48:43 (60767): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 00:06:15 (61384): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 01:06:05 (61512): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 02:05:52 (61939): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 02:15:59 (62345): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 21:04:55 (55150): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 21:56:31 (58523): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 22:44:29 (59002): No heartbeat from core client for 30 sec - exiting 22:44:30 (59002): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 63 - Return code = 1 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 64 - Return code = 1 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 65 - Return code = 1 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 66 - Return code = 1 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 67 - Return code = 1 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 68 - Return code = 1 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 69 - Return code = 1 22:47:51 (59388): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 22:50:53 (59426): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 06:09:36 (444): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 06:09:38 (444): No heartbeat from core client for 30 sec - exiting CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 22:36:03 (45789): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 20:20:00 (413): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 06:39:20 (10648): No heartbeat from core client for 30 sec - exiting 06:39:24 (10648): No heartbeat from core client for 30 sec - exiting 06:39:25 (10648): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 06:42:25 (10791): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 22:30:39 (16270): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Model crashed: INITDUMP: Wrong no of atmos prognostic fields tmp/pipe_dummy 2048 Model crashed: INITDUMP: Wrong no of atmos prognostic fields tmp/pipe_dummy 2048 Model crashed: INITDUMP: Wrong no of atmos prognostic fields tmp/pipe_dummy 2048 Model crashed: INITDUMP: Wrong no of atmos prognostic fields tmp/pipe_dummy 2048 Model crashed: INITDUMP: Wrong no of atmos prognostic fields tmp/pipe_dummy 2048 Model crashed: INITDUMP: Wrong no of atmos prognostic fields tmp/pipe_dummy 2048 Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
23 Jul 2013 20:25:07	1216073	15855025	hadcm3n_n6q1_1920_40_008393405_0	648,000	1,318,539	2.0348
23 Jul 2013 17:10:59	1216073	15855025	hadcm3n_n6q1_1920_40_008393405_0	622,080	1,267,296	2.0372
23 Jul 2013 17:10:59	1216073	15855025	hadcm3n_n6q1_1920_40_008393405_0	596,160	1,220,880	2.0479
23 Jul 2013 17:10:59	1216073	15855025	hadcm3n_n6q1_1920_40_008393405_0	570,240	1,171,000	2.0535
23 Jul 2013 17:10:59	1216073	15855025	hadcm3n_n6q1_1920_40_008393405_0	544,320	1,128,536	2.0733
23 Jul 2013 17:10:59	1216073	15855025	hadcm3n_n6q1_1920_40_008393405_0	518,400	1,079,381	2.0821
23 Jul 2013 17:10:59	1216073	15855025	hadcm3n_n6q1_1920_40_008393405_0	492,480	1,026,487	2.0843
11 Jul 2013 15:12:56	1216073	15855025	hadcm3n_n6q1_1920_40_008393405_0	466,560	967,999	2.0748
10 Jul 2013 13:46:59	1216073	15855025	hadcm3n_n6q1_1920_40_008393405_0	440,640	920,166	2.0882
08 Jul 2013 17:48:25	1216073	15855025	hadcm3n_n6q1_1920_40_008393405_0	414,720	859,266	2.0719
07 Jul 2013 22:09:40	1216073	15855025	hadcm3n_n6q1_1920_40_008393405_0	388,800	803,071	2.0655
06 Jul 2013 21:55:35	1216073	15855025	hadcm3n_n6q1_1920_40_008393405_0	362,880	742,838	2.0471
06 Jul 2013 05:48:54	1216073	15855025	hadcm3n_n6q1_1920_40_008393405_0	336,960	689,090	2.0450
06 Jul 2013 04:56:29	1216073	15855025	hadcm3n_n6q1_1920_40_008393405_0	311,040	632,248	2.0327
04 Jul 2013 14:26:11	1216073	15855025	hadcm3n_n6q1_1920_40_008393405_0	285,120	564,232	1.9789
03 Jul 2013 09:52:55	1216073	15855025	hadcm3n_n6q1_1920_40_008393405_0	259,200	490,686	1.8931
02 Jul 2013 12:07:08	1216073	15855025	hadcm3n_n6q1_1920_40_008393405_0	233,280	439,765	1.8851
02 Jul 2013 11:50:47	1216073	15855025	hadcm3n_n6q1_1920_40_008393405_0	207,360	389,332	1.8776
02 Jul 2013 10:38:24	1216073	15855025	hadcm3n_n6q1_1920_40_008393405_0	181,440	337,330	1.8592
02 Jul 2013 10:11:54	1216073	15855025	hadcm3n_n6q1_1920_40_008393405_0	155,520	283,077	1.8202