Task 13402754

Name	hadcm3n_t23q_1940_40_007445813_2
Workunit	7643316
Created	20 Sep 2011, 14:58:20 UTC
Sent	20 Sep 2011, 14:58:51 UTC
Report deadline	20 Dec 2011, 22:26:02 UTC
Received	1 Dec 2011, 12:09:38 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1170732
Run time	28 days 21 hours 16 min 13 sec
CPU time	22 days 21 hours 13 min 26 sec
Validate state	Invalid
Credit	9,331.20
Device peak FLOPS	1.47 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.12.34</core_client_version> <![CDATA[ <message> Il dispositivo non riconosce il comando. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CCPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=836, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=836, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3948, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3168, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 14:07:02 (3168): No heartbeat from core client for 30 sec - exiting 14:07:03 (3168): No heartbeat from core client for 30 sec - exiting 14:07:04 (3168): No heartbeat from core client for 30 sec - exiting 14:07:05 (3168): No heartbeat from core client for 30 sec - exiting 14:07:06 (3168): No heartbeat from core client for 30 sec - exiting 14:07:07 (3168): No heartbeat from core client for 30 sec - exiting 14:07:08 (3168): No heartbeat from core client for 30 sec - exiting 14:07:09 (3168): No heartbeat from core client for 30 sec - exiting 14:07:10 (3168): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1940, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... 18:28:33 (2920): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 09:44:41 (4064): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 11:39:04 (3680): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... 09:56:09 (3856): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2084, iMonCtr=1 Model crash detected, will try to restart... 14:49:37 (3596): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 10:39:36 (3572): No heartbeat from core client for 30 sec - exiting 10:39:37 (3572): No heartbeat from core client for 30 sec - exiting 10:39:38 (3572): No heartbeat from core client for 30 sec - exiting 10:39:39 (3572): No heartbeat from core client for 30 sec - exiting 10:39:40 (3572): No heartbeat from core client for 30 sec - exiting 10:39:42 (3572): No heartbeat from core client for 30 sec - exiting 10:39:43 (3572): No heartbeat from core client for 30 sec - exiting 10:39:44 (3572): No heartbeat from core client for 30 sec - exiting 10:39:45 (3572): No heartbeat from core client for 30 sec - exiting 10:39:46 (3572): No heartbeat from core client for 30 sec - exiting 10:39:47 (3572): No heartbeat from core client for 30 sec - exiting 10:39:48 (3572): No heartbeat from core client for 30 sec - exiting 10:39:49 (3572): No heartbeat from core client for 30 sec - exiting 10:39:50 (3572): No heartbeat from core client for 30 sec - exiting 10:39:51 (3572): No heartbeat from core client for 30 sec - exiting 10:39:52 (3572): No heartbeat from core client for 30 sec - exiting 10:39:53 (3572): No heartbeat from core client for 30 sec - exiting 10:39:54 (3572): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Model crashed: ATM_DYN : INVALID THETA DETECTED. tmp/pipe_dummy 2048 Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
28 Nov 2011 22:52:40	1170732	13402754	hadcm3n_t23q_1940_40_007445813_2	777,600	1,925,056	2.4756
27 Nov 2011 14:32:13	1170732	13402754	hadcm3n_t23q_1940_40_007445813_2	751,680	1,861,747	2.4768
21 Nov 2011 21:05:27	1170732	13402754	hadcm3n_t23q_1940_40_007445813_2	725,760	1,798,785	2.4785
20 Nov 2011 13:58:59	1170732	13402754	hadcm3n_t23q_1940_40_007445813_2	699,840	1,735,178	2.4794
19 Nov 2011 00:51:37	1170732	13402754	hadcm3n_t23q_1940_40_007445813_2	673,920	1,671,173	2.4798
17 Nov 2011 05:07:24	1170732	13402754	hadcm3n_t23q_1940_40_007445813_2	648,000	1,607,692	2.4810
15 Nov 2011 17:29:04	1170732	13402754	hadcm3n_t23q_1940_40_007445813_2	622,080	1,544,066	2.4821
15 Nov 2011 17:29:04	1170732	13402754	hadcm3n_t23q_1940_40_007445813_2	596,160	1,480,253	2.4830
15 Nov 2011 17:29:04	1170732	13402754	hadcm3n_t23q_1940_40_007445813_2	570,240	1,416,199	2.4835
09 Nov 2011 13:31:06	1170732	13402754	hadcm3n_t23q_1940_40_007445813_2	544,320	1,354,146	2.4878
07 Nov 2011 17:03:28	1170732	13402754	hadcm3n_t23q_1940_40_007445813_2	518,400	1,291,172	2.4907
03 Nov 2011 17:13:27	1170732	13402754	hadcm3n_t23q_1940_40_007445813_2	492,480	1,226,666	2.4908
02 Nov 2011 16:33:19	1170732	13402754	hadcm3n_t23q_1940_40_007445813_2	466,560	1,162,185	2.4910
31 Oct 2011 19:06:20	1170732	13402754	hadcm3n_t23q_1940_40_007445813_2	440,640	1,098,248	2.4924
31 Oct 2011 13:21:05	1170732	13402754	hadcm3n_t23q_1940_40_007445813_2	414,720	1,034,384	2.4942
18 Oct 2011 17:28:12	1170732	13402754	hadcm3n_t23q_1940_40_007445813_2	388,800	970,543	2.4963
17 Oct 2011 01:19:13	1170732	13402754	hadcm3n_t23q_1940_40_007445813_2	362,880	906,249	2.4974
15 Oct 2011 16:19:14	1170732	13402754	hadcm3n_t23q_1940_40_007445813_2	336,960	841,818	2.4983
14 Oct 2011 09:19:34	1170732	13402754	hadcm3n_t23q_1940_40_007445813_2	311,040	777,767	2.5005
11 Oct 2011 20:49:09	1170732	13402754	hadcm3n_t23q_1940_40_007445813_2	285,120	713,555	2.5026