JPS后各节点都是正常的  停了重启也还是正常的  就是各节点日志都有报错误   望各位大侠帮我分析分析也学习
搭建集群也不是第一次了 先排除配置文件的问题(我是按我正常的集群里的配置文件配置的,hadoop版本也和我那个正常集群的一样)(如果问题解决了会统一给出解决方案,后遇到这类问题的人参考参考!!)
[b]这是Namenode日志的错误信息:[/b]
2015-03-07 04:36:26,751 INFO org.apache.hadoop.hdfs.server.namenode.NameNode: STARTUP_MSG:
/************************************************************
STARTUP_MSG: Starting NameNode
STARTUP_MSG:   host = master/172.16.101.110
STARTUP_MSG:   args = []
STARTUP_MSG:   version = 0.20.2
STARTUP_MSG:   build = https://svn.apache.org/repos/asf/hadoop/common/branches/branch-0.20 -r 911707; compiled by 'chrisdo' on Fri Feb 19 08:07:34 UTC 2010
************************************************************/
2015-03-07 04:36:27,114 INFO org.apache.hadoop.ipc.metrics.RpcMetrics: Initializing RPC Metrics with hostName=NameNode, port=9000
2015-03-07 04:36:27,202 INFO org.apache.hadoop.hdfs.server.namenode.NameNode: Namenode up at: master/172.16.101.110:9000
2015-03-07 04:36:27,213 INFO org.apache.hadoop.metrics.jvm.JvmMetrics: Initializing JVM Metrics with processName=NameNode, sessionId=null
2015-03-07 04:36:27,215 INFO org.apache.hadoop.hdfs.server.namenode.metrics.NameNodeMetrics: Initializing NameNodeMeterics using context object:org.apache.hadoop.metrics.spi.NullContext
2015-03-07 04:36:27,367 INFO org.apache.hadoop.hdfs.server.namenode.FSNamesystem: fsOwner=hadoop,hadoop
2015-03-07 04:36:27,367 INFO org.apache.hadoop.hdfs.server.namenode.FSNamesystem: supergroup=supergroup
2015-03-07 04:36:27,367 INFO org.apache.hadoop.hdfs.server.namenode.FSNamesystem: isPermissionEnabled=true
2015-03-07 04:36:27,375 INFO org.apache.hadoop.hdfs.server.namenode.metrics.FSNamesystemMetrics: Initializing FSNamesystemMetrics using context object:org.apache.hadoop.metrics.spi.NullContext
2015-03-07 04:36:27,378 INFO org.apache.hadoop.hdfs.server.namenode.FSNamesystem: Registered FSNamesystemStatusMBean
2015-03-07 04:36:27,454 INFO org.apache.hadoop.hdfs.server.common.Storage: Number of files = 1
2015-03-07 04:36:27,459 INFO org.apache.hadoop.hdfs.server.common.Storage: Number of files under construction = 0
2015-03-07 04:36:27,459 INFO org.apache.hadoop.hdfs.server.common.Storage: Image file of size 96 loaded in 0 seconds.
2015-03-07 04:36:27,460 INFO org.apache.hadoop.hdfs.server.common.Storage: Edits file /home/hadoop/hdfs/name/current/edits of size 4 edits # 0 loaded in 0 seconds.
2015-03-07 04:36:27,475 INFO org.apache.hadoop.hdfs.server.common.Storage: Image file of size 96 saved in 0 seconds.
2015-03-07 04:36:27,536 INFO org.apache.hadoop.hdfs.server.namenode.FSNamesystem: Finished loading FSImage in 248 msecs
2015-03-07 04:36:27,538 INFO org.apache.hadoop.hdfs.server.namenode.FSNamesystem: Total number of blocks = 0
2015-03-07 04:36:27,538 INFO org.apache.hadoop.hdfs.server.namenode.FSNamesystem: Number of invalid blocks = 0
2015-03-07 04:36:27,539 INFO org.apache.hadoop.hdfs.server.namenode.FSNamesystem: Number of under-replicated blocks = 0
2015-03-07 04:36:27,539 INFO org.apache.hadoop.hdfs.server.namenode.FSNamesystem: Number of  over-replicated blocks = 0
2015-03-07 04:36:27,539 INFO org.apache.hadoop.hdfs.StateChange: STATE* Leaving safe mode after 0 secs.
2015-03-07 04:36:27,539 INFO org.apache.hadoop.hdfs.StateChange: STATE* Network topology has 0 racks and 0 datanodes
2015-03-07 04:36:27,539 INFO org.apache.hadoop.hdfs.StateChange: STATE* UnderReplicatedBlocks has 0 blocks
2015-03-07 04:36:40,483 INFO org.mortbay.log: Logging to org.slf4j.impl.Log4jLoggerAdapter(org.mortbay.log) via org.mortbay.log.Slf4jLog
2015-03-07 04:36:43,588 INFO org.apache.hadoop.http.HttpServer: Port returned by webServer.getConnectors()[0].getLocalPort() before open() is -1. Opening the listener on 50070
2015-03-07 04:36:44,072 INFO org.apache.hadoop.http.HttpServer: listener.getLocalPort() returned 50070 webServer.getConnectors()[0].getLocalPort() returned 50070

这是JobTracker日志的错误信息:
2015-03-07 04:37:09,834 INFO org.apache.hadoop.mapred.JobTracker: Scheduler configured with (memSizeForMapSlotOnJT, memSizeForReduceSlotOnJT, limitMaxMemForMapTasks, limitMaxMemForReduceTasks) (-1, -1, -1, -1)
2015-03-07 04:37:10,215 INFO org.apache.hadoop.ipc.metrics.RpcMetrics: Initializing RPC Metrics with hostName=JobTracker, port=9001
2015-03-07 04:37:20,543 INFO org.mortbay.log: Logging to org.slf4j.impl.Log4jLoggerAdapter(org.mortbay.log) via org.mortbay.log.Slf4jLog
2015-03-07 04:37:20,689 INFO org.apache.hadoop.http.HttpServer: Port returned by webServer.getConnectors()[0].getLocalPort() before open() is -1. Opening the listener on 50030
2015-03-07 04:37:20,691 INFO org.apache.hadoop.http.HttpServer: listener.getLocalPort() returned 50030 webServer.getConnectors()[0].getLocalPort() returned 50030
2015-03-07 04:37:20,691 INFO org.apache.hadoop.http.HttpServer: Jetty bound to port 50030
2015-03-07 04:37:20,691 INFO org.mortbay.log: jetty-6.1.14
2015-03-07 04:38:11,401 INFO org.mortbay.log: Started [email protected]:50030
2015-03-07 04:38:11,403 INFO org.apache.hadoop.metrics.jvm.JvmMetrics: Initializing JVM Metrics with processName=JobTracker, sessionId=
2015-03-07 04:38:11,404 INFO org.apache.hadoop.mapred.JobTracker: JobTracker up at: 9001
2015-03-07 04:38:11,404 INFO org.apache.hadoop.mapred.JobTracker: JobTracker webserver: 50030
2015-03-07 04:38:12,050 INFO org.apache.hadoop.mapred.JobTracker: Cleaning up the system directory
2015-03-07 04:38:12,236 INFO org.apache.hadoop.mapred.CompletedJobStatusStore: Completed job store is inactive
2015-03-07 04:38:12,854 INFO org.apache.hadoop.ipc.Server: IPC Server Responder: starting
2015-03-07 04:38:12,857 INFO org.apache.hadoop.ipc.Server: IPC Server handler 8 on 9001: starting
2015-03-07 04:38:12,857 INFO org.apache.hadoop.ipc.Server: IPC Server handler 7 on 9001: starting
2015-03-07 04:38:12,857 INFO org.apache.hadoop.ipc.Server: IPC Server handler 6 on 9001: starting
2015-03-07 04:38:12,856 INFO org.apache.hadoop.ipc.Server: IPC Server handler 5 on 9001: starting
2015-03-07 04:38:12,856 INFO org.apache.hadoop.ipc.Server: IPC Server handler 4 on 9001: starting
2015-03-07 04:38:12,856 INFO org.apache.hadoop.ipc.Server: IPC Server handler 3 on 9001: starting
2015-03-07 04:38:12,856 INFO org.apache.hadoop.ipc.Server: IPC Server handler 2 on 9001: starting
2015-03-07 04:38:12,856 INFO org.apache.hadoop.ipc.Server: IPC Server handler 1 on 9001: starting
2015-03-07 04:38:12,855 INFO org.apache.hadoop.ipc.Server: IPC Server handler 0 on 9001: starting
2015-03-07 04:38:12,855 INFO org.apache.hadoop.ipc.Server: IPC Server listener on 9001: starting
2015-03-07 04:38:12,857 INFO org.apache.hadoop.mapred.JobTracker: Starting RUNNING
2015-03-07 04:38:12,865 INFO org.apache.hadoop.ipc.Server: IPC Server handler 9 on 9001: starting
2015-03-07 04:38:13,453 INFO org.apache.hadoop.net.NetworkTopology: Adding a new node: /default-rack/node2
"hadoop-hadoop-jobtracker-master.log" 36L, 3544C         
这是SecondaryNamenode日志的错误信息:
2015-03-07 04:37:09,834 INFO org.apache.hadoop.mapred.JobTracker: Scheduler configured with (memSizeForMapSlotOnJT, memSizeForReduceSlotOnJT, limitMaxMemForMapTasks, limitMaxMemForReduceTasks) (-1, -1, -1, -1)
2015-03-07 04:37:10,215 INFO org.apache.hadoop.ipc.metrics.RpcMetrics: Initializing RPC Metrics with hostName=JobTracker, port=9001
2015-03-07 04:37:20,543 INFO org.mortbay.log: Logging to org.slf4j.impl.Log4jLoggerAdapter(org.mortbay.log) via org.mortbay.log.Slf4jLog
2015-03-07 04:37:20,689 INFO org.apache.hadoop.http.HttpServer: Port returned by webServer.getConnectors()[0].getLocalPort() before open() is -1. Opening the listener on 50030
2015-03-07 04:37:20,691 INFO org.apache.hadoop.http.HttpServer: listener.getLocalPort() returned 50030 webServer.getConnectors()[0].getLocalPort() returned 50030
2015-03-07 04:37:20,691 INFO org.apache.hadoop.http.HttpServer: Jetty bound to port 50030
2015-03-07 04:37:20,691 INFO org.mortbay.log: jetty-6.1.14
2015-03-07 04:38:11,401 INFO org.mortbay.log: Started [email protected]:50030
2015-03-07 04:38:11,403 INFO org.apache.hadoop.metrics.jvm.JvmMetrics: Initializing JVM Metrics with processName=JobTracker, sessionId=
2015-03-07 04:38:11,404 INFO org.apache.hadoop.mapred.JobTracker: JobTracker up at: 9001
2015-03-07 04:38:11,404 INFO org.apache.hadoop.mapred.JobTracker: JobTracker webserver: 50030
2015-03-07 04:38:12,050 INFO org.apache.hadoop.mapred.JobTracker: Cleaning up the system directory
2015-03-07 04:38:12,236 INFO org.apache.hadoop.mapred.CompletedJobStatusStore: Completed job store is inactive
2015-03-07 04:38:12,854 INFO org.apache.hadoop.ipc.Server: IPC Server Responder: starting
2015-03-07 04:38:12,857 INFO org.apache.hadoop.ipc.Server: IPC Server handler 8 on 9001: starting
2015-03-07 04:38:12,857 INFO org.apache.hadoop.ipc.Server: IPC Server handler 7 on 9001: starting
2015-03-07 04:38:12,857 INFO org.apache.hadoop.ipc.Server: IPC Server handler 6 on 9001: starting
2015-03-07 04:38:12,856 INFO org.apache.hadoop.ipc.Server: IPC Server handler 5 on 9001: starting
2015-03-07 04:38:12,856 INFO org.apache.hadoop.ipc.Server: IPC Server handler 4 on 9001: starting
2015-03-07 04:38:12,856 INFO org.apache.hadoop.ipc.Server: IPC Server handler 3 on 9001: starting
2015-03-07 04:38:12,856 INFO org.apache.hadoop.ipc.Server: IPC Server handler 2 on 9001: starting
2015-03-07 04:38:12,856 INFO org.apache.hadoop.ipc.Server: IPC Server handler 1 on 9001: starting
2015-03-07 04:38:12,855 INFO org.apache.hadoop.ipc.Server: IPC Server handler 0 on 9001: starting
2015-03-07 04:38:12,855 INFO org.apache.hadoop.ipc.Server: IPC Server listener on 9001: starting
2015-03-07 04:38:12,857 INFO org.apache.hadoop.mapred.JobTracker: Starting RUNNING
2015-03-07 04:38:12,865 INFO org.apache.hadoop.ipc.Server: IPC Server handler 9 on 9001: starting
2015-03-07 04:38:13,453 INFO org.apache.hadoop.net.NetworkTopology: Adding a new node: /default-rack/node2
"hadoop-hadoop-jobtracker-master.log" 36L, 3544C         

解决方案 »

  1.   

    其余日志错误信息
    这是DataNode日志的错误信息:
    2015-03-07 04:37:07,097 INFO org.apache.hadoop.hdfs.server.datanode.DataNode: STARTUP_MSG:
    /************************************************************
    STARTUP_MSG: Starting DataNode
    STARTUP_MSG:   host = node1/172.16.101.112
    STARTUP_MSG:   args = []
    STARTUP_MSG:   version = 0.20.2
    STARTUP_MSG:   build = https://svn.apache.org/repos/asf/hadoop/common/branches/branch-0.20 -r 911707; compiled by 'chrisdo' on Fri Feb 19 08:07:34 UTC 2010
    ************************************************************/
    2015-03-07 04:37:08,582 INFO org.apache.hadoop.hdfs.server.common.Storage: Storage directory /home/hadoop/hadoop-0.20.2/tmp/dfs/data is not formatted.
    2015-03-07 04:37:08,582 INFO org.apache.hadoop.hdfs.server.common.Storage: Formatting ...
    2015-03-07 04:37:08,723 INFO org.apache.hadoop.hdfs.server.datanode.DataNode: Registered FSDatasetStatusMBean
    2015-03-07 04:37:08,742 INFO org.apache.hadoop.hdfs.server.datanode.DataNode: Opened info server at 50010
    2015-03-07 04:37:08,745 INFO org.apache.hadoop.hdfs.server.datanode.DataNode: Balancing bandwith is 1048576 bytes/s
    2015-03-07 04:37:18,996 INFO org.mortbay.log: Logging to org.slf4j.impl.Log4jLoggerAdapter(org.mortbay.log) via org.mortbay.log.Slf4jLog
    2015-03-07 04:37:19,088 INFO org.apache.hadoop.http.HttpServer: Port returned by webServer.getConnectors()[0].getLocalPort() before open() is -1. Opening the listener on 50075
    2015-03-07 04:37:19,088 INFO org.apache.hadoop.http.HttpServer: listener.getLocalPort() returned 50075 webServer.getConnectors()[0].getLocalPort() returned 50075
    2015-03-07 04:37:19,088 INFO org.apache.hadoop.http.HttpServer: Jetty bound to port 50075
    2015-03-07 04:37:19,088 INFO org.mortbay.log: jetty-6.1.14
    2015-03-07 04:37:23,338 INFO org.mortbay.log: Started [email protected]:50075
    2015-03-07 04:37:23,350 INFO org.apache.hadoop.metrics.jvm.JvmMetrics: Initializing JVM Metrics with processName=DataNode, sessionId=null
    2015-03-07 04:37:33,430 INFO org.apache.hadoop.ipc.metrics.RpcMetrics: Initializing RPC Metrics with hostName=DataNode, port=50020
    2015-03-07 04:37:33,445 INFO org.apache.hadoop.ipc.Server: IPC Server Responder: starting
    2015-03-07 04:37:33,450 INFO org.apache.hadoop.ipc.Server: IPC Server listener on 50020: starting
    2015-03-07 04:37:33,457 INFO org.apache.hadoop.ipc.Server: IPC Server handler 0 on 50020: starting
    2015-03-07 04:37:33,461 INFO org.apache.hadoop.ipc.Server: IPC Server handler 1 on 50020: starting
    2015-03-07 04:37:33,461 INFO org.apache.hadoop.hdfs.server.datanode.DataNode: dnRegistration = DatanodeRegistration(node1:50010, storageID=, infoPort=50075, ipcPort=50020)
    2015-03-07 04:37:33,475 INFO org.apache.hadoop.ipc.Server: IPC Server handler 2 on 50020: starting
    2015-03-07 04:37:33,500 INFO org.apache.hadoop.hdfs.server.datanode.DataNode: New storage id DS-408303962-172.16.101.112-50010-1425731853487 is assigned to data-node 172.16.101.112:50010
    2015-03-07 04:37:33,501 INFO org.apache.hadoop.hdfs.server.datanode.DataNode: DatanodeRegistration(172.16.101.112:50010, storageID=DS-408303962-172.16.101.112-50010-1425731853487, infoPort=50075, ipcPort=50020)In DataNode.run, data = FSDataset{dirpath='/home/hadoop/hadoop-0.20.2/tmp/dfs/data/current'}
    2015-03-07 04:37:33,501 INFO org.apache.hadoop.hdfs.server.datanode.DataNode: using BLOCKREPORT_INTERVAL of 3600000msec Initial delay: 0msec
    2015-03-07 04:37:33,521 INFO org.apache.hadoop.hdfs.server.datanode.DataNode: BlockReport of 0 blocks got processed in 9 msecs
    2015-03-07 04:37:33,639 INFO org.apache.hadoop.hdfs.server.datanode.DataNode: Starting Periodic block scanner.

    这是TaskTracker日志的错误信息
    2015-03-07 04:36:58,859 INFO org.apache.hadoop.mapred.TaskTracker: STARTUP_MSG:
    /************************************************************
    STARTUP_MSG: Starting TaskTracker
    STARTUP_MSG:   host = node1/172.16.101.112
    STARTUP_MSG:   args = []
    STARTUP_MSG:   version = 0.20.2
    STARTUP_MSG:   build = https://svn.apache.org/repos/asf/hadoop/common/branches/branch-0.20 -r 911707; compiled by 'chrisdo' on Fri Feb 19 08:07:34 UTC 2010
    ************************************************************/
    2015-03-07 04:37:14,250 INFO org.mortbay.log: Logging to org.slf4j.impl.Log4jLoggerAdapter(org.mortbay.log) via org.mortbay.log.Slf4jLog
    2015-03-07 04:37:14,474 INFO org.apache.hadoop.http.HttpServer: Port returned by webServer.getConnectors()[0].getLocalPort() before open() is -1. Opening the listener on 50060
    2015-03-07 04:37:14,520 INFO org.apache.hadoop.http.HttpServer: listener.getLocalPort() returned 50060 webServer.getConnectors()[0].getLocalPort() returned 50060
    2015-03-07 04:37:14,520 INFO org.apache.hadoop.http.HttpServer: Jetty bound to port 50060
    2015-03-07 04:37:14,520 INFO org.mortbay.log: jetty-6.1.14
    2015-03-07 04:37:15,888 INFO org.mortbay.log: Started [email protected]:50060
    2015-03-07 04:37:15,896 INFO org.apache.hadoop.metrics.jvm.JvmMetrics: Initializing JVM Metrics with processName=TaskTracker, sessionId=
    2015-03-07 04:37:15,985 INFO org.apache.hadoop.ipc.metrics.RpcMetrics: Initializing RPC Metrics with hostName=TaskTracker, port=55537
    2015-03-07 04:37:16,214 INFO org.apache.hadoop.ipc.Server: IPC Server Responder: starting
    2015-03-07 04:37:16,216 INFO org.apache.hadoop.ipc.Server: IPC Server handler 2 on 55537: starting
    2015-03-07 04:37:16,216 INFO org.apache.hadoop.ipc.Server: IPC Server handler 1 on 55537: starting
    2015-03-07 04:37:16,216 INFO org.apache.hadoop.ipc.Server: IPC Server handler 0 on 55537: starting
    2015-03-07 04:37:16,215 INFO org.apache.hadoop.ipc.Server: IPC Server listener on 55537: starting
    2015-03-07 04:37:16,216 INFO org.apache.hadoop.mapred.TaskTracker: TaskTracker up at: localhost/127.0.0.1:55537
    2015-03-07 04:37:16,219 INFO org.apache.hadoop.mapred.TaskTracker: Starting tracker tracker_node1:localhost/127.0.0.1:55537
    2015-03-07 04:37:16,223 INFO org.apache.hadoop.ipc.Server: IPC Server handler 3 on 55537: starting
    2015-03-07 04:38:13,131 INFO org.apache.hadoop.mapred.TaskTracker: Starting thread: Map-events fetcher for all reduce tasks on tracker_node1:localhost/127.0.0.1:55537
    2015-03-07 04:38:13,142 INFO org.apache.hadoop.mapred.TaskTracker:  Using MemoryCalculatorPlugin : org.apache.hadoop.util.LinuxMemoryCalculatorPlugin@741827d1
    2015-03-07 04:38:13,153 WARN org.apache.hadoop.mapred.TaskTracker: TaskTracker's totalMemoryAllottedForTasks is -1. TaskMemoryManager is disabled.
    2015-03-07 04:38:13,158 INFO org.apache.hadoop.mapred.IndexCache: IndexCache created with max memory = 10485760
    2015-03-07 05:33:38,397 INFO org.apache.hadoop.mapred.TaskTracker: LaunchTaskAction (registerTask): attempt_201503070437_0001_m_000002_0 task's state:UNASSIGNED
    2015-03-07 05:33:38,432 INFO org.apache.hadoop.mapred.TaskTracker: Trying to launch : attempt_201503070437_0001_m_000002_0
    2015-03-07 05:33:38,432 INFO org.apache.hadoop.mapred.TaskTracker: In TaskLauncher, current free slots : 2 and trying to launch attempt_201503070437_0001_m_000002_0