Task 15541472

Name	hadcm3n_37wt_1940_40_008268461_1
Workunit	8423585
Created	14 Jan 2013, 2:27:42 UTC
Sent	14 Jan 2013, 2:27:58 UTC
Report deadline	15 Apr 2013, 9:55:09 UTC
Received	11 Feb 2013, 15:02:49 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1219123
Run time	11 days 2 hours 3 min 45 sec
CPU time	7 days 20 hours 2 min 48 sec
Validate state	Invalid
Credit	7,464.96
Device peak FLOPS	3.27 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=9692, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5820, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5820, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5820, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: WRITDUMP: BAD BUFFOUT OF DATA tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: STWORK : Error in PP_FILE tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: STWORK : Error in PP_FILE tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: STWORK : Error in PP_FILE tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: STWORK : Error in PP_FILE tmp/pipe_dummy 2048 BUFFOUT: C I/O Error - Return code = 32 Model crashed: STWORK : Error in PP_FILE tmp/pipe_dummy 2048 forrtl: There is not enough space on the disk. Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5148, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
10 Feb 2013 23:39:05	1219123	15541472	hadcm3n_37wt_1940_40_008268461_1	622,080	776,146	1.2477
10 Feb 2013 13:50:28	1219123	15541472	hadcm3n_37wt_1940_40_008268461_1	596,160	743,274	1.2468
09 Feb 2013 19:40:33	1219123	15541472	hadcm3n_37wt_1940_40_008268461_1	570,240	709,822	1.2448
09 Feb 2013 07:06:25	1219123	15541472	hadcm3n_37wt_1940_40_008268461_1	544,320	676,404	1.2427
08 Feb 2013 21:38:24	1219123	15541472	hadcm3n_37wt_1940_40_008268461_1	518,400	644,839	1.2439
08 Feb 2013 12:18:19	1219123	15541472	hadcm3n_37wt_1940_40_008268461_1	492,480	613,169	1.2451
07 Feb 2013 19:48:49	1219123	15541472	hadcm3n_37wt_1940_40_008268461_1	466,560	581,145	1.2456
07 Feb 2013 09:23:08	1219123	15541472	hadcm3n_37wt_1940_40_008268461_1	440,640	548,667	1.2452
06 Feb 2013 13:50:20	1219123	15541472	hadcm3n_37wt_1940_40_008268461_1	414,720	515,939	1.2441
05 Feb 2013 17:56:45	1219123	15541472	hadcm3n_37wt_1940_40_008268461_1	388,800	483,690	1.2441
05 Feb 2013 06:31:27	1219123	15541472	hadcm3n_37wt_1940_40_008268461_1	362,880	451,523	1.2443
04 Feb 2013 20:12:12	1219123	15541472	hadcm3n_37wt_1940_40_008268461_1	336,960	419,721	1.2456
03 Feb 2013 23:10:29	1219123	15541472	hadcm3n_37wt_1940_40_008268461_1	311,040	387,270	1.2451
03 Feb 2013 02:16:11	1219123	15541472	hadcm3n_37wt_1940_40_008268461_1	285,120	355,046	1.2453
02 Feb 2013 14:15:32	1219123	15541472	hadcm3n_37wt_1940_40_008268461_1	259,200	322,685	1.2449
02 Feb 2013 04:19:37	1219123	15541472	hadcm3n_37wt_1940_40_008268461_1	233,280	291,021	1.2475
01 Feb 2013 08:16:44	1219123	15541472	hadcm3n_37wt_1940_40_008268461_1	207,360	258,349	1.2459
31 Jan 2013 14:40:31	1219123	15541472	hadcm3n_37wt_1940_40_008268461_1	181,440	225,905	1.2451
30 Jan 2013 20:12:09	1219123	15541472	hadcm3n_37wt_1940_40_008268461_1	155,520	193,520	1.2443
30 Jan 2013 08:53:10	1219123	15541472	hadcm3n_37wt_1940_40_008268461_1	129,600	161,031	1.2425