请问下高手们: 有什么工具可以解析wikipedia的数据呀

解决方案 »

  1.   

    HttpURLConnection/ socket  
    用socket 发表单请求到http://www.wikipedia.org/search-redirect.php, post/get方法 带上 参数searchInput/ language/searchInput 
    响应数据用JEditorPane显示或自己手动分析..wikipedia的 搜词表单 下面
    <form id="searchform" action="http://www.wikipedia.org/search-redirect.php"> 
    <fieldset> 
     
    <input id="searchInput" name="search" type="search" size="20" autofocus="autofocus" /> 
     
    <select id="language" name="language" onchange="setLang(this.value);"> 
    <!-- 100,000+ articles, sorted by romanization - keep in sync with langs in selectLanguage() in /js --> 
    <option value="ar" lang="ar">العربية</option><!-- Al-ʿArabīyah --> 
    <option value="bg" lang="bg">Български</option><!-- Bulgarski --> 
    <option value="ca" lang="ca">Català</option> 
    <option value="cs" lang="cs">Česky</option> 
    <option value="da" lang="da">Dansk</option> 
    <option value="de" lang="de">Deutsch</option> 
    <option value="en" lang="en" selected="selected">English</option> 
    <option value="es" lang="es">Español</option> 
    <option value="eo" lang="eo">Esperanto</option> 
    <option value="fa" lang="fa">فارسی</option><!-- Fārsi --> 
    <option value="fr" lang="fr">Français</option> 
    <option value="ko" lang="ko">한국어</option><!-- Hangugeo --> 
    <option value="id" lang="id">Bahasa Indonesia</option> 
    <option value="it" lang="it">Italiano</option> 
    <option value="he" lang="he">עברית</option><!-- ‘Ivrit --> 
    <option value="lt" lang="lt">Lietuvių</option> 
    <option value="hu" lang="hu">Magyar</option> 
    <option value="ms" lang="ms">Bahasa Melayu</option> 
    <option value="nl" lang="nl">Nederlands</option> 
    <option value="ja" lang="ja">日本語</option><!-- Nihongo --> 
    <option value="no" lang="nb">Norsk (bokmål)</option> 
    <option value="pl" lang="pl">Polski</option> 
    <option value="pt" lang="pt">Português</option> 
    <option value="ro" lang="ro">Română</option> 
    <option value="ru" lang="ru">Русский</option><!-- Russkiy --> 
    <option value="sk" lang="sk">Slovenčina</option> 
    <option value="sl" lang="sl">Slovenščina</option> 
    <option value="sr" lang="sr">Српски / Srpski</option> 
    <option value="fi" lang="fi">Suomi</option> 
    <option value="sv" lang="sv">Svenska</option> 
    <option value="tr" lang="tr">Türkçe</option> 
    <option value="uk" lang="uk">Українська</option><!-- Ukrayins’ka --> 
    <option value="vi" lang="vi">Tiếng Việt</option> 
    <option value="vo" lang="vo">Volapük</option> 
    <option value="war" lang="war">Winaray</option> 
    <option value="zh" lang="zh">中文</option><!-- Zhōngwén --> 
    </select> 
     
    <input class="searchButton" type="submit" value="  →  " name="go" /> 
    <input type="hidden" value="Go" name="go" /> 
     
    </fieldset> 
    </form>