Task 13265579

Name	hadcm3n_t4ow_1980_40_007412223_0
Workunit	7609853
Created	17 Aug 2011, 0:47:58 UTC
Sent	18 Aug 2011, 18:11:40 UTC
Report deadline	18 Nov 2011, 1:38:51 UTC
Received	17 Dec 2011, 13:30:21 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	399245
Run time	8 days 10 hours 57 min 24 sec
CPU time	6 days 5 hours 22 min 8 sec
Validate state	Invalid
Credit	4,043.52
Device peak FLOPS	2.13 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.12.34</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6644, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3652, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4724, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4516, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4164, iMonCtr=1 Model crash detected, will try to restart... 09:38:11 (4512): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5588, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
11 Dec 2011 18:30:12	399245	13265579	hadcm3n_t4ow_1980_40_007412223_0	336,960	522,014	1.5492
27 Nov 2011 17:13:00	399245	13265579	hadcm3n_t4ow_1980_40_007412223_0	311,040	482,508	1.5513
19 Nov 2011 11:24:24	399245	13265579	hadcm3n_t4ow_1980_40_007412223_0	285,120	442,342	1.5514
31 Oct 2011 14:52:04	399245	13265579	hadcm3n_t4ow_1980_40_007412223_0	259,200	403,372	1.5562
31 Oct 2011 13:35:00	399245	13265579	hadcm3n_t4ow_1980_40_007412223_0	233,280	361,967	1.5516
08 Oct 2011 10:31:04	399245	13265579	hadcm3n_t4ow_1980_40_007412223_0	207,360	320,493	1.5456
27 Sep 2011 21:35:53	399245	13265579	hadcm3n_t4ow_1980_40_007412223_0	181,440	279,754	1.5419
24 Sep 2011 07:00:30	399245	13265579	hadcm3n_t4ow_1980_40_007412223_0	155,520	239,747	1.5416
10 Sep 2011 12:05:30	399245	13265579	hadcm3n_t4ow_1980_40_007412223_0	129,600	198,211	1.5294
04 Sep 2011 15:08:03	399245	13265579	hadcm3n_t4ow_1980_40_007412223_0	103,680	159,085	1.5344
31 Aug 2011 11:24:28	399245	13265579	hadcm3n_t4ow_1980_40_007412223_0	77,760	119,848	1.5413
30 Aug 2011 11:15:50	399245	13265579	hadcm3n_t4ow_1980_40_007412223_0	51,840	79,083	1.5255
21 Aug 2011 11:27:31	399245	13265579	hadcm3n_t4ow_1980_40_007412223_0	25,920	40,946	1.5797