Task 16099065

Name	hadcm3n_n53z_1880_40_008372571_2
Workunit	8523430
Created	28 Nov 2013, 8:02:19 UTC
Sent	28 Nov 2013, 8:02:28 UTC
Report deadline	27 Feb 2014, 15:29:39 UTC
Received	7 Dec 2013, 10:28:57 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1297503
Run time	7 days 8 hours 6 min 53 sec
CPU time	7 days 0 hours 53 min 14 sec
Validate state	Invalid
Credit	7,464.96
Device peak FLOPS	3.91 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.2.33</core_client_version> <![CDATA[ <message> Le périphérique ne reconnaît pas la commande. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 23:17:10 (2192): Can't acquire lockfile (32) - waiting 35s 23:17:39 (5024): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 23:10:16 (2192): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4812, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4812, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4812, iMonCtr=1 Model crash detected, will try to restart... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4700, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4700, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4700, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
07 Dec 2013 02:28:33	1297503	16099065	hadcm3n_n53z_1880_40_008372571_2	622,080	580,980	0.9339
06 Dec 2013 18:19:22	1297503	16099065	hadcm3n_n53z_1880_40_008372571_2	596,160	551,311	0.9248
06 Dec 2013 09:28:00	1297503	16099065	hadcm3n_n53z_1880_40_008372571_2	570,240	521,750	0.9150
06 Dec 2013 01:34:39	1297503	16099065	hadcm3n_n53z_1880_40_008372571_2	544,320	492,186	0.9042
04 Dec 2013 19:48:07	1297503	16099065	hadcm3n_n53z_1880_40_008372571_2	518,400	463,159	0.8934
04 Dec 2013 12:09:27	1297503	16099065	hadcm3n_n53z_1880_40_008372571_2	492,480	437,827	0.8890
04 Dec 2013 00:52:36	1297503	16099065	hadcm3n_n53z_1880_40_008372571_2	466,560	411,169	0.8813
03 Dec 2013 18:05:04	1297503	16099065	hadcm3n_n53z_1880_40_008372571_2	440,640	386,901	0.8780
03 Dec 2013 11:33:57	1297503	16099065	hadcm3n_n53z_1880_40_008372571_2	414,720	363,784	0.8772
02 Dec 2013 21:51:19	1297503	16099065	hadcm3n_n53z_1880_40_008372571_2	388,800	340,626	0.8761
02 Dec 2013 15:06:46	1297503	16099065	hadcm3n_n53z_1880_40_008372571_2	362,880	316,362	0.8718
02 Dec 2013 08:18:48	1297503	16099065	hadcm3n_n53z_1880_40_008372571_2	336,960	292,144	0.8670
02 Dec 2013 01:32:02	1297503	16099065	hadcm3n_n53z_1880_40_008372571_2	311,040	267,907	0.8613
01 Dec 2013 18:50:23	1297503	16099065	hadcm3n_n53z_1880_40_008372571_2	285,120	243,698	0.8547
01 Dec 2013 12:03:57	1297503	16099065	hadcm3n_n53z_1880_40_008372571_2	259,200	219,430	0.8466
01 Dec 2013 05:27:49	1297503	16099065	hadcm3n_n53z_1880_40_008372571_2	233,280	195,216	0.8368
30 Nov 2013 21:01:11	1297503	16099065	hadcm3n_n53z_1880_40_008372571_2	207,360	170,974	0.8245
30 Nov 2013 11:15:55	1297503	16099065	hadcm3n_n53z_1880_40_008372571_2	181,440	147,407	0.8124
30 Nov 2013 03:13:32	1297503	16099065	hadcm3n_n53z_1880_40_008372571_2	155,520	123,498	0.7941
29 Nov 2013 20:31:33	1297503	16099065	hadcm3n_n53z_1880_40_008372571_2	129,600	99,342	0.7665