Task 12503255

Name	famous_v0ku_1799_200_006736228_4
Workunit	6939568
Created	18 Jan 2011, 13:23:42 UTC
Sent	21 Jan 2011, 0:36:18 UTC
Report deadline	22 Apr 2011, 8:03:29 UTC
Received	13 Feb 2011, 13:32:59 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1121922
Run time	14 days 5 hours 33 min 7 sec
CPU time	11 days 8 hours 18 min 26 sec
Validate state	Invalid
Credit	4,045.58
Device peak FLOPS	1.29 GFLOPS
Application version	UK Met Office FAMOUS v6.11 i686-pc-linux-gnu
Stderr	<core_client_version>6.10.58</core_client_version> <![CDATA[ <message> process exited with code 22 (0x16, -234) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... (1186): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... (1169): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... (1182): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 60 - Return code = 1 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 61 - Return code = 1 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 68 - Return code = 1 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 69 - Return code = 1 CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... (1264): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 60 - Return code = 1 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 61 - Return code = 1 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 68 - Return code = 1 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 69 - Return code = 1 Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 60 - Return code = 1 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 61 - Return code = 1 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 68 - Return code = 1 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 69 - Return code = 1 CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... (1163): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2692, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2692, iMonCtr=1 Model crash detected, will try to restart... terminate called after throwing an instance of 'std::bad_alloc' what(): St9bad_alloc SIGABRT: abort called Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2692, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2692, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2692, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2692, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( (2692): called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
13 Feb 2011 13:38:58	1121922	12503255	famous_v0ku_1799_200_006736228_4	1,226,186	975,426	0.7955
12 Feb 2011 23:44:51	1121922	12503255	famous_v0ku_1799_200_006736228_4	1,216,826	967,975	0.7955
12 Feb 2011 21:09:09	1121922	12503255	famous_v0ku_1799_200_006736228_4	1,207,466	960,521	0.7955
12 Feb 2011 18:34:43	1121922	12503255	famous_v0ku_1799_200_006736228_4	1,198,106	953,076	0.7955
12 Feb 2011 15:46:42	1121922	12503255	famous_v0ku_1799_200_006736228_4	1,188,746	945,629	0.7955
12 Feb 2011 13:05:13	1121922	12503255	famous_v0ku_1799_200_006736228_4	1,179,386	938,164	0.7955
12 Feb 2011 10:27:27	1121922	12503255	famous_v0ku_1799_200_006736228_4	1,170,026	930,727	0.7955
12 Feb 2011 07:53:57	1121922	12503255	famous_v0ku_1799_200_006736228_4	1,160,666	923,281	0.7955
12 Feb 2011 05:21:44	1121922	12503255	famous_v0ku_1799_200_006736228_4	1,151,306	915,862	0.7955
12 Feb 2011 02:53:30	1121922	12503255	famous_v0ku_1799_200_006736228_4	1,141,946	908,448	0.7955
12 Feb 2011 00:22:17	1121922	12503255	famous_v0ku_1799_200_006736228_4	1,132,586	901,020	0.7955
11 Feb 2011 21:47:23	1121922	12503255	famous_v0ku_1799_200_006736228_4	1,123,226	893,579	0.7955
11 Feb 2011 19:16:51	1121922	12503255	famous_v0ku_1799_200_006736228_4	1,113,866	886,451	0.7958
11 Feb 2011 19:03:54	1121922	12503255	famous_v0ku_1799_200_006736228_4	1,104,506	878,987	0.7958
11 Feb 2011 19:03:54	1121922	12503255	famous_v0ku_1799_200_006736228_4	1,095,146	871,546	0.7958
10 Feb 2011 23:10:09	1121922	12503255	famous_v0ku_1799_200_006736228_4	1,085,786	864,101	0.7958
10 Feb 2011 20:41:00	1121922	12503255	famous_v0ku_1799_200_006736228_4	1,076,426	856,664	0.7958
10 Feb 2011 19:54:56	1121922	12503255	famous_v0ku_1799_200_006736228_4	1,067,066	849,205	0.7958
10 Feb 2011 02:57:18	1121922	12503255	famous_v0ku_1799_200_006736228_4	1,057,706	841,779	0.7959
10 Feb 2011 00:25:47	1121922	12503255	famous_v0ku_1799_200_006736228_4	1,048,346	834,352	0.7959