Task 15790540

Name	hadcm3n_4i3i_1940_40_008308947_2
Workunit	8460082
Created	20 May 2013, 3:47:37 UTC
Sent	20 May 2013, 3:47:41 UTC
Report deadline	19 Aug 2013, 11:14:52 UTC
Received	2 Jun 2013, 22:33:57 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	913414
Run time	3 days 0 hours 35 min 43 sec
CPU time	3 days 0 hours 35 min 43 sec
Validate state	Invalid
Credit	1,244.16
Device peak FLOPS	2.21 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.2.19</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> 18:47:08 (31144): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 18:47:09 (31144): No heartbeat from core client for 30 sec - exiting 18:47:10 (31144): No heartbeat from core client for 30 sec - exiting 07:13:20 (230000): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 07:13:22 (230000): No heartbeat from core client for 30 sec - exiting 07:13:23 (230000): No heartbeat from core client for 30 sec - exiting 07:13:24 (230000): No heartbeat from core client for 30 sec - exiting 07:13:25 (230000): No heartbeat from core client for 30 sec - exiting 07:13:26 (230000): No heartbeat from core client for 30 sec - exiting 07:13:27 (230000): No heartbeat from core client for 30 sec - exiting 20:53:28 (249092): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 20:53:29 (249092): No heartbeat from core client for 30 sec - exiting 20:53:30 (249092): No heartbeat from core client for 30 sec - exiting 20:53:31 (249092): No heartbeat from core client for 30 sec - exiting 20:53:32 (249092): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - Suspend request from BOINC... Called boinc_finish Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2584, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2584, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2584, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2584, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2584, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=2584, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
02 Jun 2013 22:34:50	913414	15790540	hadcm3n_4i3i_1940_40_008308947_2	103,680	201,538	1.9438
22 May 2013 01:55:55	913414	15790540	hadcm3n_4i3i_1940_40_008308947_2	77,760	151,149	1.9438
21 May 2013 09:58:29	913414	15790540	hadcm3n_4i3i_1940_40_008308947_2	51,840	101,077	1.9498
20 May 2013 23:49:28	913414	15790540	hadcm3n_4i3i_1940_40_008308947_2	25,920	51,317	1.9798