Task 15597868

Name	hadcm3n_48ax_1940_40_008310535_0
Workunit	8461670
Created	8 Feb 2013, 1:14:02 UTC
Sent	9 Feb 2013, 3:02:24 UTC
Report deadline	11 May 2013, 10:29:35 UTC
Received	15 Mar 2013, 13:23:34 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1264691
Run time	22 days 8 hours 31 min 35 sec
CPU time	22 days 4 hours 23 min 42 sec
Validate state	Invalid
Credit	11,508.48
Device peak FLOPS	1.94 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.28</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2284, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1896, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3088, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3632, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3632, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3632, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3632, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3632, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3376, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3376, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
14 Mar 2013 11:40:38	1264691	15597868	hadcm3n_48ax_1940_40_008310535_0	959,040	1,874,773	1.9548
10 Mar 2013 19:12:02	1264691	15597868	hadcm3n_48ax_1940_40_008310535_0	933,120	1,821,567	1.9521
10 Mar 2013 03:50:25	1264691	15597868	hadcm3n_48ax_1940_40_008310535_0	907,200	1,768,283	1.9492
09 Mar 2013 13:03:13	1264691	15597868	hadcm3n_48ax_1940_40_008310535_0	881,280	1,715,156	1.9462
08 Mar 2013 22:14:26	1264691	15597868	hadcm3n_48ax_1940_40_008310535_0	855,360	1,661,963	1.9430
08 Mar 2013 06:45:52	1264691	15597868	hadcm3n_48ax_1940_40_008310535_0	829,440	1,608,866	1.9397
05 Mar 2013 01:03:42	1264691	15597868	hadcm3n_48ax_1940_40_008310535_0	803,520	1,555,478	1.9358
04 Mar 2013 10:08:47	1264691	15597868	hadcm3n_48ax_1940_40_008310535_0	777,600	1,502,065	1.9317
03 Mar 2013 19:39:46	1264691	15597868	hadcm3n_48ax_1940_40_008310535_0	751,680	1,448,764	1.9274
03 Mar 2013 03:59:47	1264691	15597868	hadcm3n_48ax_1940_40_008310535_0	725,760	1,395,538	1.9229
02 Mar 2013 13:05:10	1264691	15597868	hadcm3n_48ax_1940_40_008310535_0	699,840	1,342,225	1.9179
28 Feb 2013 06:22:09	1264691	15597868	hadcm3n_48ax_1940_40_008310535_0	673,920	1,288,997	1.9127
27 Feb 2013 15:30:40	1264691	15597868	hadcm3n_48ax_1940_40_008310535_0	648,000	1,235,731	1.9070
27 Feb 2013 01:30:07	1264691	15597868	hadcm3n_48ax_1940_40_008310535_0	622,080	1,185,542	1.9058
26 Feb 2013 11:11:03	1264691	15597868	hadcm3n_48ax_1940_40_008310535_0	596,160	1,134,388	1.9028
25 Feb 2013 21:10:48	1264691	15597868	hadcm3n_48ax_1940_40_008310535_0	570,240	1,084,228	1.9014
25 Feb 2013 07:19:15	1264691	15597868	hadcm3n_48ax_1940_40_008310535_0	544,320	1,034,488	1.9005
24 Feb 2013 17:32:21	1264691	15597868	hadcm3n_48ax_1940_40_008310535_0	518,400	985,179	1.9004
24 Feb 2013 03:48:23	1264691	15597868	hadcm3n_48ax_1940_40_008310535_0	492,480	935,987	1.9006
23 Feb 2013 13:40:18	1264691	15597868	hadcm3n_48ax_1940_40_008310535_0	466,560	885,484	1.8979