Task 12888873

Name	hadcm3n_p42l_1900_40_007222861_2
Workunit	7421101
Created	17 May 2011, 14:25:14 UTC
Sent	17 May 2011, 14:25:17 UTC
Report deadline	16 Aug 2011, 21:52:28 UTC
Received	10 Jun 2011, 13:45:02 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1104245
Run time	14 days 0 hours 32 min 37 sec
CPU time	12 days 4 hours 23 min 41 sec
Validate state	Invalid
Credit	7,776.00
Device peak FLOPS	2.68 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.56</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 10:23:14 (6164): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=37724, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=37724, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=37724, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=37724, iMonCtr=1 Model crash detected, will try to restart... Signal 11 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=37724, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
09 Jun 2011 23:13:03	1104245	12888873	hadcm3n_p42l_1900_40_007222861_2	648,000	1,123,592	1.7339
09 Jun 2011 05:09:31	1104245	12888873	hadcm3n_p42l_1900_40_007222861_2	622,080	1,075,200	1.7284
08 Jun 2011 09:01:02	1104245	12888873	hadcm3n_p42l_1900_40_007222861_2	596,160	1,026,625	1.7221
07 Jun 2011 19:49:39	1104245	12888873	hadcm3n_p42l_1900_40_007222861_2	570,240	981,621	1.7214
07 Jun 2011 07:38:47	1104245	12888873	hadcm3n_p42l_1900_40_007222861_2	544,320	939,152	1.7254
06 Jun 2011 17:31:10	1104245	12888873	hadcm3n_p42l_1900_40_007222861_2	518,400	891,228	1.7192
06 Jun 2011 05:43:49	1104245	12888873	hadcm3n_p42l_1900_40_007222861_2	492,480	848,101	1.7221
05 Jun 2011 16:56:30	1104245	12888873	hadcm3n_p42l_1900_40_007222861_2	466,560	800,925	1.7167
05 Jun 2011 00:37:32	1104245	12888873	hadcm3n_p42l_1900_40_007222861_2	440,640	753,360	1.7097
04 Jun 2011 15:32:46	1104245	12888873	hadcm3n_p42l_1900_40_007222861_2	414,720	721,946	1.7408
04 Jun 2011 07:27:25	1104245	12888873	hadcm3n_p42l_1900_40_007222861_2	388,800	690,532	1.7761
03 Jun 2011 22:21:09	1104245	12888873	hadcm3n_p42l_1900_40_007222861_2	362,880	659,101	1.8163
03 Jun 2011 09:42:51	1104245	12888873	hadcm3n_p42l_1900_40_007222861_2	336,960	616,585	1.8298
02 Jun 2011 14:36:49	1104245	12888873	hadcm3n_p42l_1900_40_007222861_2	311,040	567,013	1.8230
30 May 2011 15:41:04	1104245	12888873	hadcm3n_p42l_1900_40_007222861_2	285,120	518,787	1.8195
28 May 2011 23:19:43	1104245	12888873	hadcm3n_p42l_1900_40_007222861_2	259,200	471,935	1.8207
27 May 2011 22:46:24	1104245	12888873	hadcm3n_p42l_1900_40_007222861_2	233,280	428,704	1.8377
27 May 2011 10:55:52	1104245	12888873	hadcm3n_p42l_1900_40_007222861_2	207,360	386,064	1.8618
26 May 2011 22:40:49	1104245	12888873	hadcm3n_p42l_1900_40_007222861_2	181,440	342,421	1.8872
26 May 2011 09:58:46	1104245	12888873	hadcm3n_p42l_1900_40_007222861_2	155,520	298,058	1.9165