Task 12742535

Name	hadcm3n_o44a_1900_40_007200669_0
Workunit	7398949
Created	28 Mar 2011, 14:09:12 UTC
Sent	30 Mar 2011, 19:12:03 UTC
Report deadline	30 Jun 2011, 2:39:14 UTC
Received	20 Apr 2011, 16:30:32 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	906256
Run time	0 sec
CPU time	8 days 23 hours 57 min 21 sec
Validate state	Invalid
Credit	5,909.76
Device peak FLOPS	2.54 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.2.18</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 09:26:44 (1936): No heartbeat from core client for 30 sec - exiting 09:26:45 (1936): No heartbeat from core client for 30 sec - exiting 09:26:46 (1936): No heartbeat from core client for 30 sec - exiting 09:26:47 (1936): No heartbeat from core client for 30 sec - exiting 09:26:48 (1936): No heartbeat from core client for 30 sec - exiting 09:26:50 (1936): No heartbeat from core client for 30 sec - exiting 09:26:51 (1936): No heartbeat from core client for 30 sec - exiting 09:26:52 (1936): No heartbeat from core client for 30 sec - exiting 09:26:53 (1936): No heartbeat from core client for 30 sec - exiting 09:26:54 (1936): No heartbeat from core client for 30 sec - exiting 09:26:55 (1936): No heartbeat from core client for 30 sec - exiting 09:26:56 (1936): No heartbeat from core client for 30 sec - exiting 09:26:57 (1936): No heartbeat from core client for 30 sec - exiting 09:26:58 (1936): No heartbeat from core client for 30 sec - exiting 09:26:59 (1936): No heartbeat from core client for 30 sec - exiting 09:27:01 (1936): No heartbeat from core client for 30 sec - exiting 09:27:02 (1936): No heartbeat from core client for 30 sec - exiting 09:27:03 (1936): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3116, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3116, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3116, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3116, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3116, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3116, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
20 Apr 2011 18:18:06	906256	12742535	hadcm3n_o44a_1900_40_007200669_0	492,480	763,810	1.5509
20 Apr 2011 18:18:06	906256	12742535	hadcm3n_o44a_1900_40_007200669_0	466,560	722,878	1.5494
20 Apr 2011 18:18:06	906256	12742535	hadcm3n_o44a_1900_40_007200669_0	440,640	681,846	1.5474
20 Apr 2011 18:18:06	906256	12742535	hadcm3n_o44a_1900_40_007200669_0	414,720	640,254	1.5438
20 Apr 2011 18:18:06	906256	12742535	hadcm3n_o44a_1900_40_007200669_0	388,800	600,317	1.5440
13 Apr 2011 07:36:01	906256	12742535	hadcm3n_o44a_1900_40_007200669_0	362,880	560,236	1.5439
12 Apr 2011 19:10:34	906256	12742535	hadcm3n_o44a_1900_40_007200669_0	336,960	519,075	1.5405
12 Apr 2011 09:07:36	906256	12742535	hadcm3n_o44a_1900_40_007200669_0	311,040	477,629	1.5356
12 Apr 2011 09:06:18	906256	12742535	hadcm3n_o44a_1900_40_007200669_0	285,120	436,750	1.5318
10 Apr 2011 15:48:02	906256	12742535	hadcm3n_o44a_1900_40_007200669_0	259,200	396,202	1.5286
10 Apr 2011 04:30:15	906256	12742535	hadcm3n_o44a_1900_40_007200669_0	233,280	355,998	1.5261
09 Apr 2011 17:13:24	906256	12742535	hadcm3n_o44a_1900_40_007200669_0	207,360	315,898	1.5234
09 Apr 2011 06:00:02	906256	12742535	hadcm3n_o44a_1900_40_007200669_0	181,440	276,028	1.5213
08 Apr 2011 18:43:29	906256	12742535	hadcm3n_o44a_1900_40_007200669_0	155,520	236,205	1.5188
08 Apr 2011 07:15:57	906256	12742535	hadcm3n_o44a_1900_40_007200669_0	129,600	196,128	1.5133
07 Apr 2011 15:55:55	906256	12742535	hadcm3n_o44a_1900_40_007200669_0	103,680	156,768	1.5120
07 Apr 2011 04:53:20	906256	12742535	hadcm3n_o44a_1900_40_007200669_0	77,760	117,685	1.5134
06 Apr 2011 17:49:28	906256	12742535	hadcm3n_o44a_1900_40_007200669_0	51,840	78,882	1.5216
05 Apr 2011 22:32:36	906256	12742535	hadcm3n_o44a_1900_40_007200669_0	25,920	40,313	1.5553