Task 13021387

Name	hadcm3n_t4c2_1940_40_007312666_2
Workunit	7510096
Created	28 Jun 2011, 15:38:40 UTC
Sent	28 Jun 2011, 15:40:41 UTC
Report deadline	27 Sep 2011, 23:07:52 UTC
Received	26 Jul 2011, 17:19:06 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1136733
Run time	9 days 15 hours 8 min 28 sec
CPU time	8 days 3 hours 24 min 48 sec
Validate state	Invalid
Credit	5,909.76
Device peak FLOPS	3.10 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 i686-apple-darwin
Stderr	<core_client_version>6.12.33</core_client_version> <![CDATA[ <message> process exited with code 22 (0x16, -234) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 23:17:13 (7713): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 63 - Return code = 1 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 64 - Return code = 1 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 65 - Return code = 1 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 66 - Return code = 1 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 67 - Return code = 1 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 68 - Return code = 1 BUFFIN: Read Failed: No such file or directory BUFFIN: C I/O Error feof - Unit 69 - Return code = 1 Error: Input file: dataout/t4c2ko.pjf2c10 is not a valid UM file. Error converting file to netcdf: dataout/t4c2ko.pjf2c10 Error: Input file: dataout/t4c2ko.pif2c10 is not a valid UM file. Error converting file to netcdf: dataout/t4c2ko.pif2c10 Error: Input file: dataout/t4c2ko.pff2c10 is not a valid UM file. Error converting file to netcdf: dataout/t4c2ko.pff2c10 Error: Input file: dataout/t4c2ka.phf2c10 is not a valid UM file. Error converting file to netcdf: dataout/t4c2ka.phf2c10 Error: Input file: dataout/t4c2ka.pgf2c10 is not a valid UM file. Error converting file to netcdf: dataout/t4c2ka.pgf2c10 Error: Input file: dataout/t4c2ka.pef2c10 is not a valid UM file. Error converting file to netcdf: dataout/t4c2ka.pef2c10 Error: Input file: dataout/t4c2ka.pdf2c10 is not a valid UM file. Error converting file to netcdf: dataout/t4c2ka.pdf2c10 CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 08:08:41 (4033): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... execl(/Library/Application Support/BOINC Data/projects/climateprediction.net/hadcm3n_um_6.07_i686-apple-darwin, 133230) failed! Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=861, iMonCtr=1 Model crash detected, will try to restart... execl(/Library/Application Support/BOINC Data/projects/climateprediction.net/hadcm3n_um_6.07_i686-apple-darwin, 133230) failed! Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=861, iMonCtr=1 Model crash detected, will try to restart... execl(/Library/Application Support/BOINC Data/projects/climateprediction.net/hadcm3n_um_6.07_i686-apple-darwin, 133230) failed! Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=861, iMonCtr=1 Model crash detected, will try to restart... execl(/Library/Application Support/BOINC Data/projects/climateprediction.net/hadcm3n_um_6.07_i686-apple-darwin, 133230) failed! Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=861, iMonCtr=1 Model crash detected, will try to restart... execl(/Library/Application Support/BOINC Data/projects/climateprediction.net/hadcm3n_um_6.07_i686-apple-darwin, 133230) failed! Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=861, iMonCtr=1 Model crash detected, will try to restart... execl(/Library/Application Support/BOINC Data/projects/climateprediction.net/hadcm3n_um_6.07_i686-apple-darwin, 133230) failed! Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=861, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
25 Jul 2011 21:53:39	1136733	13021387	hadcm3n_t4c2_1940_40_007312666_2	492,480	692,228	1.4056
25 Jul 2011 19:46:16	1136733	13021387	hadcm3n_t4c2_1940_40_007312666_2	466,560	655,815	1.4056
25 Jul 2011 19:43:54	1136733	13021387	hadcm3n_t4c2_1940_40_007312666_2	440,640	619,037	1.4049
25 Jul 2011 18:55:05	1136733	13021387	hadcm3n_t4c2_1940_40_007312666_2	414,720	582,043	1.4035
25 Jul 2011 17:36:58	1136733	13021387	hadcm3n_t4c2_1940_40_007312666_2	388,800	545,266	1.4024
25 Jul 2011 15:42:50	1136733	13021387	hadcm3n_t4c2_1940_40_007312666_2	362,880	508,387	1.4010
25 Jul 2011 13:38:02	1136733	13021387	hadcm3n_t4c2_1940_40_007312666_2	336,960	470,858	1.3974
10 Jul 2011 21:24:21	1136733	13021387	hadcm3n_t4c2_1940_40_007312666_2	311,040	434,071	1.3955
09 Jul 2011 20:01:36	1136733	13021387	hadcm3n_t4c2_1940_40_007312666_2	285,120	397,506	1.3942
08 Jul 2011 09:29:07	1136733	13021387	hadcm3n_t4c2_1940_40_007312666_2	259,200	361,432	1.3944
07 Jul 2011 16:04:41	1136733	13021387	hadcm3n_t4c2_1940_40_007312666_2	233,280	325,090	1.3936
07 Jul 2011 16:04:41	1136733	13021387	hadcm3n_t4c2_1940_40_007312666_2	207,360	289,404	1.3957
05 Jul 2011 15:42:08	1136733	13021387	hadcm3n_t4c2_1940_40_007312666_2	181,440	253,515	1.3972
05 Jul 2011 06:22:54	1136733	13021387	hadcm3n_t4c2_1940_40_007312666_2	155,520	215,992	1.3888
05 Jul 2011 06:22:54	1136733	13021387	hadcm3n_t4c2_1940_40_007312666_2	129,600	180,453	1.3924
02 Jul 2011 21:13:29	1136733	13021387	hadcm3n_t4c2_1940_40_007312666_2	103,680	144,354	1.3923
01 Jul 2011 07:28:10	1136733	13021387	hadcm3n_t4c2_1940_40_007312666_2	77,760	107,826	1.3867
30 Jun 2011 07:34:06	1136733	13021387	hadcm3n_t4c2_1940_40_007312666_2	51,840	72,250	1.3937
29 Jun 2011 15:47:41	1136733	13021387	hadcm3n_t4c2_1940_40_007312666_2	25,920	36,605	1.4122