Task 12847712

Name	hadcm3n_p37u_1900_40_007221754_2
Workunit	7419994
Created	1 May 2011, 9:09:36 UTC
Sent	1 May 2011, 9:26:50 UTC
Report deadline	31 Jul 2011, 16:54:01 UTC
Received	18 Jul 2011, 11:39:57 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1143940
Run time	4 days 1 hours 41 min 36 sec
CPU time	4 days 0 hours 40 min 53 sec
Validate state	Invalid
Credit	2,799.36
Device peak FLOPS	2.07 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.60</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2984, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3252, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3848, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... 01:47:13 (2568): No heartbeat from core client for 30 sec - exiting 01:47:14 (2568): No heartbeat from core client for 30 sec - exiting 01:47:15 (2568): No heartbeat from core client for 30 sec - exiting 01:47:17 (2568): No heartbeat from core client for 30 sec - exiting 01:47:18 (2568): No heartbeat from core client for 30 sec - exiting 01:47:19 (2568): No heartbeat from core client for 30 sec - exiting 01:47:20 (2568): No heartbeat from core client for 30 sec - exiting 01:47:21 (2568): No heartbeat from core client for 30 sec - exiting 01:47:22 (2568): No heartbeat from core client for 30 sec - exiting 01:47:23 (2568): No heartbeat from core client for 30 sec - exiting 01:47:24 (2568): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1072, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3972, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4248, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
10 May 2011 15:26:33	1143940	12847712	hadcm3n_p37u_1900_40_007221754_2	233,280	341,685	1.4647
09 May 2011 23:55:12	1143940	12847712	hadcm3n_p37u_1900_40_007221754_2	207,360	296,389	1.4293
09 May 2011 11:13:17	1143940	12847712	hadcm3n_p37u_1900_40_007221754_2	181,440	251,142	1.3842
09 May 2011 05:34:03	1143940	12847712	hadcm3n_p37u_1900_40_007221754_2	155,520	273,783	1.7604
08 May 2011 08:33:44	1143940	12847712	hadcm3n_p37u_1900_40_007221754_2	129,600	228,110	1.7601
07 May 2011 00:06:01	1143940	12847712	hadcm3n_p37u_1900_40_007221754_2	103,680	182,230	1.7576
06 May 2011 05:39:22	1143940	12847712	hadcm3n_p37u_1900_40_007221754_2	77,760	137,102	1.7631
05 May 2011 17:19:08	1143940	12847712	hadcm3n_p37u_1900_40_007221754_2	51,840	92,022	1.7751
03 May 2011 07:12:49	1143940	12847712	hadcm3n_p37u_1900_40_007221754_2	25,920	46,202	1.7825