Task 12735764

Name	hadcm3n_o1ig_1900_40_007197291_0
Workunit	7395571
Created	28 Mar 2011, 14:00:30 UTC
Sent	1 Apr 2011, 17:46:59 UTC
Report deadline	2 Jul 2011, 1:14:10 UTC
Received	20 Apr 2011, 15:23:34 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1139103
Run time	13 days 16 hours 20 min 51 sec
CPU time	12 days 21 hours 37 min 21 sec
Validate state	Invalid
Credit	6,220.80
Device peak FLOPS	2.77 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.58</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Ocean Restart file copy failed on o1igko.dab0c20 Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4284, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6456, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6456, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6456, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6456, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6456, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=6456, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
20 Apr 2011 15:29:41	1139103	12735764	hadcm3n_o1ig_1900_40_007197291_0	518,400	1,090,529	2.1036
20 Apr 2011 15:29:41	1139103	12735764	hadcm3n_o1ig_1900_40_007197291_0	492,480	1,035,349	2.1023
20 Apr 2011 15:29:41	1139103	12735764	hadcm3n_o1ig_1900_40_007197291_0	466,560	980,716	2.1020
13 Apr 2011 14:45:01	1139103	12735764	hadcm3n_o1ig_1900_40_007197291_0	440,640	925,740	2.1009
12 Apr 2011 22:36:56	1139103	12735764	hadcm3n_o1ig_1900_40_007197291_0	414,720	870,938	2.1001
12 Apr 2011 09:08:20	1139103	12735764	hadcm3n_o1ig_1900_40_007197291_0	388,800	816,135	2.0991
12 Apr 2011 09:06:52	1139103	12735764	hadcm3n_o1ig_1900_40_007197291_0	362,880	761,060	2.0973
12 Apr 2011 09:06:02	1139103	12735764	hadcm3n_o1ig_1900_40_007197291_0	336,960	706,081	2.0954
12 Apr 2011 09:05:22	1139103	12735764	hadcm3n_o1ig_1900_40_007197291_0	311,040	651,173	2.0935
12 Apr 2011 09:04:34	1139103	12735764	hadcm3n_o1ig_1900_40_007197291_0	285,120	596,117	2.0908
08 Apr 2011 14:29:21	1139103	12735764	hadcm3n_o1ig_1900_40_007197291_0	259,200	541,509	2.0892
07 Apr 2011 21:58:36	1139103	12735764	hadcm3n_o1ig_1900_40_007197291_0	233,280	487,003	2.0876
07 Apr 2011 05:52:02	1139103	12735764	hadcm3n_o1ig_1900_40_007197291_0	207,360	432,497	2.0857
06 Apr 2011 12:00:29	1139103	12735764	hadcm3n_o1ig_1900_40_007197291_0	181,440	376,326	2.0741
05 Apr 2011 19:56:02	1139103	12735764	hadcm3n_o1ig_1900_40_007197291_0	155,520	322,080	2.0710
05 Apr 2011 04:00:36	1139103	12735764	hadcm3n_o1ig_1900_40_007197291_0	129,600	268,084	2.0685
04 Apr 2011 11:43:48	1139103	12735764	hadcm3n_o1ig_1900_40_007197291_0	103,680	213,936	2.0634
03 Apr 2011 19:57:06	1139103	12735764	hadcm3n_o1ig_1900_40_007197291_0	77,760	160,242	2.0607
03 Apr 2011 04:09:13	1139103	12735764	hadcm3n_o1ig_1900_40_007197291_0	51,840	106,509	2.0546
02 Apr 2011 12:23:04	1139103	12735764	hadcm3n_o1ig_1900_40_007197291_0	25,920	53,072	2.0475