Task 15478031

Name	hadcm3n_zce3_1880_40_008245667_2
Workunit	8400791
Created	14 Dec 2012, 12:16:36 UTC
Sent	14 Dec 2012, 12:16:41 UTC
Report deadline	15 Mar 2013, 19:43:52 UTC
Received	31 Jan 2013, 7:23:58 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1191123
Run time	4 days 18 hours 3 min 28 sec
CPU time	4 days 4 hours 7 min 50 sec
Validate state	Invalid
Credit	4,665.60
Device peak FLOPS	2.98 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.10.58</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 19:13:04 (2796): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 03:17:58 (3400): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 08:16:42 (4000): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 10:42:52 (3452): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1904, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1904, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1904, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1904, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1904, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1904, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
21 Dec 2012 03:59:03	1191123	15478031	hadcm3n_zce3_1880_40_008245667_2	388,800	354,974	0.9130
20 Dec 2012 14:37:13	1191123	15478031	hadcm3n_zce3_1880_40_008245667_2	362,880	331,176	0.9126
20 Dec 2012 02:39:57	1191123	15478031	hadcm3n_zce3_1880_40_008245667_2	336,960	307,406	0.9123
19 Dec 2012 16:43:20	1191123	15478031	hadcm3n_zce3_1880_40_008245667_2	311,040	283,680	0.9120
19 Dec 2012 06:21:31	1191123	15478031	hadcm3n_zce3_1880_40_008245667_2	285,120	260,072	0.9121
18 Dec 2012 23:05:05	1191123	15478031	hadcm3n_zce3_1880_40_008245667_2	259,200	236,424	0.9121
18 Dec 2012 10:36:59	1191123	15478031	hadcm3n_zce3_1880_40_008245667_2	233,280	212,752	0.9120
17 Dec 2012 19:27:28	1191123	15478031	hadcm3n_zce3_1880_40_008245667_2	207,360	189,186	0.9124
17 Dec 2012 09:19:47	1191123	15478031	hadcm3n_zce3_1880_40_008245667_2	181,440	165,537	0.9124
17 Dec 2012 02:08:33	1191123	15478031	hadcm3n_zce3_1880_40_008245667_2	155,520	142,071	0.9135
16 Dec 2012 13:00:26	1191123	15478031	hadcm3n_zce3_1880_40_008245667_2	129,600	118,409	0.9136
16 Dec 2012 03:58:40	1191123	15478031	hadcm3n_zce3_1880_40_008245667_2	103,680	94,742	0.9138
15 Dec 2012 20:51:23	1191123	15478031	hadcm3n_zce3_1880_40_008245667_2	77,760	71,394	0.9181
15 Dec 2012 07:13:17	1191123	15478031	hadcm3n_zce3_1880_40_008245667_2	51,840	47,719	0.9205
14 Dec 2012 19:58:57	1191123	15478031	hadcm3n_zce3_1880_40_008245667_2	25,920	24,333	0.9388