Task 16219952

Name	hadcm3n_7cam_1980_40_008427217_1
Workunit	8578073
Created	14 Jan 2014, 0:26:52 UTC
Sent	14 Jan 2014, 0:27:12 UTC
Report deadline	15 Apr 2014, 7:54:23 UTC
Received	10 Feb 2014, 10:26:56 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1236068
Run time	22 days 20 hours 5 min 57 sec
CPU time	22 days 17 hours 10 min 24 sec
Validate state	Invalid
Credit	10,575.36
Device peak FLOPS	2.30 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.2.33</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> 21:45:14 (4592): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... BUFFIN: C I/O Error feof - Unit 63 - Return code = 16 BUFFIN: C I/O Error feof - Unit 64 - Return code = 16 BUFFIN: C I/O Error feof - Unit 65 - Return code = 16 BUFFIN: C I/O Error feof - Unit 66 - Return code = 16 BUFFIN: C I/O Error feof - Unit 67 - Return code = 16 BUFFIN: C I/O Error feof - Unit 68 - Return code = 16 BUFFIN: C I/O Error feof - Unit 69 - Return code = 16 Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 07:04:17 (4992): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4108, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4108, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4108, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4108, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4108, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4108, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
10 Feb 2014 06:26:47	1236068	16219952	hadcm3n_7cam_1980_40_008427217_1	881,280	1,955,048	2.2184
09 Feb 2014 14:01:48	1236068	16219952	hadcm3n_7cam_1980_40_008427217_1	855,360	1,896,125	2.2168
08 Feb 2014 21:53:29	1236068	16219952	hadcm3n_7cam_1980_40_008427217_1	829,440	1,836,683	2.2144
07 Feb 2014 12:36:03	1236068	16219952	hadcm3n_7cam_1980_40_008427217_1	803,520	1,777,575	2.2122
05 Feb 2014 21:08:06	1236068	16219952	hadcm3n_7cam_1980_40_008427217_1	777,600	1,719,529	2.2113
05 Feb 2014 05:10:19	1236068	16219952	hadcm3n_7cam_1980_40_008427217_1	751,680	1,661,838	2.2108
04 Feb 2014 13:19:50	1236068	16219952	hadcm3n_7cam_1980_40_008427217_1	725,760	1,605,047	2.2115
03 Feb 2014 21:16:55	1236068	16219952	hadcm3n_7cam_1980_40_008427217_1	699,840	1,547,463	2.2112
03 Feb 2014 01:09:45	1236068	16219952	hadcm3n_7cam_1980_40_008427217_1	673,920	1,491,155	2.2127
02 Feb 2014 09:28:36	1236068	16219952	hadcm3n_7cam_1980_40_008427217_1	648,000	1,435,049	2.2146
01 Feb 2014 17:20:18	1236068	16219952	hadcm3n_7cam_1980_40_008427217_1	622,080	1,377,788	2.2148
01 Feb 2014 01:50:33	1236068	16219952	hadcm3n_7cam_1980_40_008427217_1	596,160	1,320,864	2.2156
31 Jan 2014 01:51:40	1236068	16219952	hadcm3n_7cam_1980_40_008427217_1	570,240	1,264,089	2.2168
30 Jan 2014 18:03:15	1236068	16219952	hadcm3n_7cam_1980_40_008427217_1	544,320	1,206,001	2.2156
30 Jan 2014 18:03:15	1236068	16219952	hadcm3n_7cam_1980_40_008427217_1	518,400	1,147,766	2.2141
30 Jan 2014 18:03:15	1236068	16219952	hadcm3n_7cam_1980_40_008427217_1	492,480	1,089,689	2.2127
28 Jan 2014 08:51:25	1236068	16219952	hadcm3n_7cam_1980_40_008427217_1	466,560	1,031,725	2.2113
27 Jan 2014 17:32:30	1236068	16219952	hadcm3n_7cam_1980_40_008427217_1	440,640	975,030	2.2128
27 Jan 2014 01:51:23	1236068	16219952	hadcm3n_7cam_1980_40_008427217_1	414,720	918,154	2.2139
26 Jan 2014 09:27:08	1236068	16219952	hadcm3n_7cam_1980_40_008427217_1	388,800	862,189	2.2176