Task 11528467

Name	famous_uhi2_1799_200_006655525_1
Workunit	6858897
Created	10 Jun 2010, 14:18:24 UTC
Sent	24 Aug 2010, 22:29:40 UTC
Report deadline	24 Nov 2010, 5:56:51 UTC
Received	26 Sep 2010, 22:12:30 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	-226 (0xFFFFFF1E) ERR_TOO_MANY_EXITS
Computer ID	1096125
Run time	14 days 6 hours 38 min 28 sec
CPU time	9 days 10 hours 32 min 53 sec
Validate state	Invalid
Credit	2,532.38
Device peak FLOPS	1.39 GFLOPS
Application version	UK Met Office FAMOUS v6.11 windows_intelx86
Stderr	<core_client_version>6.10.58</core_client_version> <![CDATA[ <message> too many exit(0)s </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1724, iMonCtr=1 Model crash detected, will try to restart... BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 60 - Return code = 16 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 61 - Return code = 16 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 68 - Return code = 16 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 69 - Return code = 16 Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=2616, selfPID=2616, iMonCtr=1 BUFFIN: Read Failed: Result too large BUFFIN: C I/O Error feof - Unit 60 - Return code = 16 BUFFIN: Read Failed: Result too large BUFFIN: C I/O Error feof - Unit 61 - Return code = 16 BUFFIN: Read Failed: Result too large BUFFIN: C I/O Error feof - Unit 68 - Return code = 16 BUFFIN: Read Failed: Result too large BUFFIN: C I/O Error feof - Unit 69 - Return code = 16 CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 60 - Return code = 16 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 61 - Return code = 16 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 68 - Return code = 16 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 69 - Return code = 16 Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3340, iMonCtr=1 Model crash detected, will try to restart... BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 60 - Return code = 16 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 61 - Return code = 16 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 68 - Return code = 16 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 69 - Return code = 16 MainError: 04:52:39 PM No files match the supplied pattern. MainError: 04:52:39 PM No files match the supplied pattern. Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=5964, selfPID=5964, iMonCtr=1 BUFFIN: Read Failed: Result too large BUFFIN: C I/O Error feof - Unit 60 - Return code = 16 BUFFIN: Read Failed: Result too large BUFFIN: C I/O Error feof - Unit 61 - Return code = 16 BUFFIN: Read Failed: Result too large BUFFIN: C I/O Error feof - Unit 68 - Return code = 16 BUFFIN: Read Failed: Result too large BUFFIN: C I/O Error feof - Unit 69 - Return code = 16 CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3020, iMonCtr=1 Model crash detected, will try to restart... Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=2988, selfPID=2988, iMonCtr=1 Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=1072, selfPID=1072, iMonCtr=1 CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=3792, selfPID=3792, iMonCtr=1 Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3856, iMonCtr=1 Model crash detected, will try to restart... </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
26 Sep 2010 19:13:41	1096125	11528467	famous_uhi2_1799_200_006655525_1	767,546	808,468	1.0533
26 Sep 2010 16:02:04	1096125	11528467	famous_uhi2_1799_200_006655525_1	758,186	798,088	1.0526
26 Sep 2010 13:09:14	1096125	11528467	famous_uhi2_1799_200_006655525_1	748,826	788,071	1.0524
26 Sep 2010 04:13:50	1096125	11528467	famous_uhi2_1799_200_006655525_1	739,466	777,079	1.0509
26 Sep 2010 02:42:54	1096125	11528467	famous_uhi2_1799_200_006655525_1	730,106	766,829	1.0503
25 Sep 2010 21:00:36	1096125	11528467	famous_uhi2_1799_200_006655525_1	720,746	756,424	1.0495
25 Sep 2010 15:20:55	1096125	11528467	famous_uhi2_1799_200_006655525_1	711,386	746,457	1.0493
25 Sep 2010 11:19:18	1096125	11528467	famous_uhi2_1799_200_006655525_1	702,026	735,859	1.0482
24 Sep 2010 23:34:17	1096125	11528467	famous_uhi2_1799_200_006655525_1	692,666	724,979	1.0467
24 Sep 2010 20:05:07	1096125	11528467	famous_uhi2_1799_200_006655525_1	683,306	714,739	1.0460
24 Sep 2010 15:42:17	1096125	11528467	famous_uhi2_1799_200_006655525_1	673,946	704,280	1.0450
24 Sep 2010 13:23:53	1096125	11528467	famous_uhi2_1799_200_006655525_1	664,586	694,198	1.0446
24 Sep 2010 10:00:29	1096125	11528467	famous_uhi2_1799_200_006655525_1	655,226	684,596	1.0448
24 Sep 2010 07:24:16	1096125	11528467	famous_uhi2_1799_200_006655525_1	645,866	675,449	1.0458
24 Sep 2010 02:38:20	1096125	11528467	famous_uhi2_1799_200_006655525_1	636,506	665,819	1.0461
23 Sep 2010 21:21:09	1096125	11528467	famous_uhi2_1799_200_006655525_1	627,146	656,442	1.0467
23 Sep 2010 18:41:31	1096125	11528467	famous_uhi2_1799_200_006655525_1	617,786	647,054	1.0474
23 Sep 2010 15:59:36	1096125	11528467	famous_uhi2_1799_200_006655525_1	608,426	637,641	1.0480
23 Sep 2010 13:25:59	1096125	11528467	famous_uhi2_1799_200_006655525_1	599,066	628,566	1.0492
23 Sep 2010 10:43:18	1096125	11528467	famous_uhi2_1799_200_006655525_1	589,706	619,265	1.0501