climateprediction.net home page
Task 13904545

Task 13904545

Name hadam3p_pnw_736o_2004_1_007676638_2
Workunit 7831725
Created 12 Jan 2012, 14:44:26 UTC
Sent 12 Jan 2012, 15:29:01 UTC
Report deadline 24 Dec 2012, 20:49:01 UTC
Received 8 Feb 2012, 2:43:14 UTC
Server state Over
Outcome Computation error
Client state Compute error
Exit status 0 (0x00000000)
Computer ID 1190644
Run time 14 hours 44 min 22 sec
CPU time 12 hours 43 min 47 sec
Validate state Invalid
Credit 252.40
Device peak FLOPS 2.53 GFLOPS
Application version UK Met Office HadAM3P-HadRM3P Pacific North West v6.09
windows_intelx86
Stderr
<core_client_version>6.12.34</core_client_version>
<![CDATA[
<stderr_txt>
Suspended CPDN Monitor - Suspend request from BOINC...
16:59:50 (11968): No heartbeat from core client for 30 sec - exiting
CPDN Monitor - No 'heartbeat' from BOINC...
16:59:51 (11968): No heartbeat from core client for 30 sec - exiting
17:33:03 (13868): Can't acquire lockfile (32) - waiting 35s
17:33:38 (13868): Can't acquire lockfile (32) - exiting
17:33:38 (13868): Error: El proceso no tiene acceso al archivo porque est&#225; siendo utilizado por otro proceso. (0x20)
17:36:33 (13640): Can't acquire lockfile (32) - waiting 35s
17:37:08 (13640): Can't acquire lockfile (32) - exiting
17:37:08 (13640): Error: El proceso no tiene acceso al archivo porque est&#225; siendo utilizado por otro proceso. (0x20)
17:43:13 (12828): Can't acquire lockfile (32) - waiting 35s
17:43:48 (12828): Can't acquire lockfile (32) - exiting
17:43:48 (12828): Error: El proceso no tiene acceso al archivo porque est&#225; siendo utilizado por otro proceso. (0x20)
17:53:14 (14144): Can't acquire lockfile (32) - waiting 35s
17:53:49 (14144): Can't acquire lockfile (32) - exiting
17:53:49 (14144): Error: El proceso no tiene acceso al archivo porque est&#225; siendo utilizado por otro proceso. (0x20)
18:03:24 (14076): Can't acquire lockfile (32) - waiting 35s
18:03:59 (14076): Can't acquire lockfile (32) - exiting
18:03:59 (14076): Error: El proceso no tiene acceso al archivo porque est&#225; siendo utilizado por otro proceso. (0x20)
18:12:55 (14364): Can't acquire lockfile (32) - waiting 35s
18:13:30 (14364): Can't acquire lockfile (32) - exiting
18:13:30 (14364): Error: El proceso no tiene acceso al archivo porque est&#225; siendo utilizado por otro proceso. (0x20)
18:20:36 (11736): Can't acquire lockfile (32) - waiting 35s
18:21:11 (11736): Can't acquire lockfile (32) - exiting
18:21:11 (11736): Error: El proceso no tiene acceso al archivo porque est&#225; siendo utilizado por otro proceso. (0x20)
18:24:01 (14620): Can't acquire lockfile (32) - waiting 35s
18:24:36 (14620): Can't acquire lockfile (32) - exiting
18:24:36 (14620): Error: El proceso no tiene acceso al archivo porque est&#225; siendo utilizado por otro proceso. (0x20)
18:27:42 (14944): Can't acquire lockfile (32) - waiting 35s
18:28:17 (14944): Can't acquire lockfile (32) - exiting
18:28:17 (14944): Error: El proceso no tiene acceso al archivo porque est&#225; siendo utilizado por otro proceso. (0x20)
18:31:03 (5116): Can't acquire lockfile (32) - waiting 35s
18:31:38 (5116): Can't acquire lockfile (32) - exiting
18:31:38 (5116): Error: El proceso no tiene acceso al archivo porque est&#225; siendo utilizado por otro proceso. (0x20)
18:35:14 (11488): Can't acquire lockfile (32) - waiting 35s
18:35:49 (11488): Can't acquire lockfile (32) - exiting
18:35:49 (11488): Error: El proceso no tiene acceso al archivo porque est&#225; siendo utilizado por otro proceso. (0x20)
18:39:45 (15900): Can't acquire lockfile (32) - waiting 35s
18:40:20 (15900): Can't acquire lockfile (32) - exiting
18:40:20 (15900): Error: El proceso no tiene acceso al archivo porque est&#225; siendo utilizado por otro proceso. (0x20)
18:43:16 (16288): Can't acquire lockfile (32) - waiting 35s
18:43:51 (16288): Can't acquire lockfile (32) - exiting
18:43:51 (16288): Error: El proceso no tiene acceso al archivo porque est&#225; siendo utilizado por otro proceso. (0x20)
18:46:58 (15720): Can't acquire lockfile (32) - waiting 35s
18:47:33 (15720): Can't acquire lockfile (32) - exiting
18:47:33 (15720): Error: El proceso no tiene acceso al archivo porque est&#225; siendo utilizado por otro proceso. (0x20)
18:50:48 (16296): Can't acquire lockfile (32) - waiting 35s
18:51:23 (16296): Can't acquire lockfile (32) - exiting
18:51:23 (16296): Error: El proceso no tiene acceso al archivo porque est&#225; siendo utilizado por otro proceso. (0x20)
CPDN Monitor - Quit request from BOINC...
CPDN Monitor - Quit request from BOINC...
Suspended CPDN Monitor - Suspend request from BOINC...
CPDN Monitor - Quit request from BOINC...
Suspended CPDN Monitor - Suspend request from BOINC...
Suspended CPDN Monitor - Suspend request from BOINC...
Suspended CPDN Monitor - Suspend request from BOINC...
Suspended CPDN Monitor - Suspend request from BOINC...
Suspended CPDN Monitor - Suspend request from BOINC...
Suspended CPDN Monitor - Suspend request from BOINC...
Suspended CPDN Monitor - Suspend request from BOINC...
Suspended CPDN Monitor - Suspend request from BOINC...
Suspended CPDN Monitor - Suspend request from BOINC...
Suspended CPDN Monitor - Suspend request from BOINC...
Suspended CPDN Monitor - Suspend request from BOINC...
CPDN Monitor - Quit request from BOINC...
Suspended CPDN Monitor - Suspend request from BOINC...
CPDN Monitor - Quit request from BOINC...
Suspended CPDN Monitor - Suspend request from BOINC...
CPDN Monitor - Quit request from BOINC...
No Process Handle
Regional Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=3152, selfPID=3152, iMonCtr=2
CPDN Monitor - Quit request from BOINC...
CPDN Monitor - Quit request from BOINC...
CPDN Monitor - Quit request from BOINC...
Suspended CPDN Monitor - Suspend request from BOINC...
CPDN Monitor - Quit request from BOINC...
CPDN Monitor - Quit request from BOINC...
Regional Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=8456, selfPID=8456, iMonCtr=2
CPDN Monitor - Quit request from BOINC...
forrtl: severe (47): write to READONLY file, unit 6, file C:\Tools\BOINC\Data\projects\climateprediction.net\hadam3p_pnw_736o_2004_1_007676638\dataout\xaakm.out

Image              PC        Routine            Line        Source             
hadam3p_pnw_um_6.  00C7A39A  Unknown               Unknown  Unknown
hadam3p_pnw_um_6.  00C22CD0  Unknown               Unknown  Unknown
hadam3p_pnw_um_6.  00C21E9A  Unknown               Unknown  Unknown
hadam3p_pnw_um_6.  00BF38EA  Unknown               Unknown  Unknown
hadam3p_pnw_um_6.  00B9E79E  Unknown               Unknown  Unknown
hadam3p_pnw_um_6.  00B9F2DA  Unknown               Unknown  Unknown
hadam3p_pnw_um_6.  00919BD2  Unknown               Unknown  Unknown
hadam3p_pnw_um_6.  00C5E638  Unknown               Unknown  Unknown
kernel32.dll       7644339A  Unknown               Unknown  Unknown
ntdll.dll          76F39EF2  Unknown               Unknown  Unknown
ntdll.dll          76F39EC5  Unknown               Unknown  Unknown
Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=2712, selfPID=5636, iMonCtr=1
Model crash detected, will try to restart...
Leaving CPDN_Main::Monitor...
Regional yearly means requires 12 input files got 1
Called boinc_finish

</stderr_txt>
<message>
upload failure: <file_xfer_error>
  <file_name>hadam3p_pnw_736o_2004_1_007676638_2_2.zip</file_name>
  <error_code>-161</error_code>
</file_xfer_error>
<file_xfer_error>
  <file_name>hadam3p_pnw_736o_2004_1_007676638_2_3.zip</file_name>
  <error_code>-161</error_code>
</file_xfer_error>
<file_xfer_error>
  <file_name>hadam3p_pnw_736o_2004_1_007676638_2_4.zip</file_name>
  <error_code>-161</error_code>
</file_xfer_error>
<file_xfer_error>
  <file_name>hadam3p_pnw_736o_2004_1_007676638_2_5.zip</file_name>
  <error_code>-161</error_code>
</file_xfer_error>
<file_xfer_error>
  <file_name>hadam3p_pnw_736o_2004_1_007676638_2_6.zip</file_name>
  <error_code>-161</error_code>
</file_xfer_error>
<file_xfer_error>
  <file_name>hadam3p_pnw_736o_2004_1_007676638_2_7.zip</file_name>
  <error_code>-161</error_code>
</file_xfer_error>
<file_xfer_error>
  <file_name>hadam3p_pnw_736o_2004_1_007676638_2_8.zip</file_name>
  <error_code>-161</error_code>
</file_xfer_error>
<file_xfer_error>
  <file_name>hadam3p_pnw_736o_2004_1_007676638_2_9.zip</file_name>
  <error_code>-161</error_code>
</file_xfer_error>
<file_xfer_error>
  <file_name>hadam3p_pnw_736o_2004_1_007676638_2_10.zip</file_name>
  <error_code>-161</error_code>
</file_xfer_error>
<file_xfer_error>
  <file_name>hadam3p_pnw_736o_2004_1_007676638_2_11.zip</file_name>
  <error_code>-161</error_code>
</file_xfer_error>
<file_xfer_error>
  <file_name>hadam3p_pnw_736o_2004_1_007676638_2_12.zip</file_name>
  <error_code>-161</error_code>
</file_xfer_error>

</message>
]]>
Latest Trickles Received
Time Sent (UTC) Host ID Result ID Result Name Timestep CPU Time (sec) Average (sec/TS)
06 Feb 2012 14:22:54 1190644 13904545 hadam3p_pnw_736o_2004_1_007676638_2 11,616 39,778 3.4244


©2024 cpdn.org