我现在写的解析,可以解析出来,但是得到的信息都是聚集 到一块放的,无法 一一对应 ,如下:(下面这样的是把整个网页的链接地址,类型,演员等等。。取出来,并没有根据电影名,去取它的链接地址,类型,年份,简介所以无法对应信息,就没有办法想数据库中添加)
得到的视频连接地址====优酷:http://v.youku.com/v_show/id_XMjM1ODg2NTI0.html
得到的视频连接地址====腾讯:http://v.qq.com/cover/5/5z9i20bjdbu7o5s.html
得到的视频连接地址====m1905:http://www.m1905.com/vod/play/414939.shtml
得到的视频连接地址====土豆:http://www.tudou.com/albumplay/y8xqpQk9rl0.html
得到的视频连接地址====酷6:http://v.ku6.com/film/index_12077.html
得到的视频连接地址====搜狐:http://tv.sohu.com/20110622/n311307784.shtml
得到的视频连接地址====乐视:http://www.letv.com/ptv/pplay/47173/1.html
得到的视频连接地址====奇艺:http://www.iqiyi.com/dianying/20100625/n21704.html
得到的视频连接地址====优酷:http://v.youku.com/v_show/id_XMTk2OTc0OTgw.html
得到的视频连接地址====PPTV:http://v.pptv.com/show/8Holowtx4RibCAMw.html
得到的视频连接地址====腾讯:http://v.qq.com/cover/v/vj6tv4fzptv23p6.html
得到的视频连接地址====迅雷:http://kankan.xunlei.com/vod/mp4/12/12317.shtml?id=731010
得到的视频连接地址====土豆:http://www.tudou.com/albumplay/7h9IGtuYfQ0.html
得到的视频连接地址====奇艺:http://www.iqiyi.com/dianying/20120309/46c750b00bbdaba9.html
得到的视频连接地址====新浪:http://video.sina.com.cn/m/ido_61681565.html
得到的视频连接地址====迅雷:http://kankan.xunlei.com/vod/mp4/64/64494.shtml?id=731010
得到的视频连接地址====乐视:http://www.letv.com/ptv/pplay/72630/1.html
得到的视频连接地址====腾讯:http://v.qq.com/cover/9/9aj41mzmtbqtn16.html
得到的视频连接地址====m1905:http://www.m1905.com/vod/play/501028.shtml
得到的视频连接地址====优酷:http://v.youku.com/v_show/id_XMzYwNDAyNDgw.html得到图片的地址。http://img0.hao123.com/data/54ee78f5d6a471e6b85487d530d55438
得到图片的地址。http://img4.hao123.com/data/8cf7bb8fc172117022c707eb0d624eca
得到图片的地址。http://img.hao123.com/data/899a767e76e1123b2a8a0f9840c2eb3f
得到图片的地址。http://img3.hao123.com/data/00a69e504f6c75f0d702be7e08096bf3
得到图片的地址。http://img6.hao123.com/data/abefc06b6a14bf92de54df1d343f2501
得到图片的地址。http://img2.hao123.com/data/4ec582fc773807f3842cc4913ba931ee
得到图片的地址。http://img3.hao123.com/data/4aaef930eb3e4c7a76413c7a5870194c
得到图片的地址。http://img3.hao123.com/data/4f7f5ef0027a03fc13300e6f590d9325
得到图片的地址。http://img5.hao123.com/data/037da0c486e557a4628bd9fcbf2155fa
得到图片的地址。http://img3.hao123.com/data/a7ed86cd9e0c15f6f45fa95a9533e3eb
得到图片的地址。http://img.hao123.com/data/a74ee6de6e3e35ef6bc388cb7263b634
得到图片的地址。http://img6.hao123.com/data/2cb06e174e4d5169ccc7a2a997801d8b
得到图片的地址。http://img4.hao123.com/data/88c154383de40d8e7f07fe03cc8bc849
得到图片的地址。http://img.hao123.com/data/ff68ca36a8012d0ff80d8bda9fb45cca
得到图片的地址。http://img5.hao123.com/data/b431db46cef9ecb35d29b1894e684a08
得到图片的地址。http://img5.hao123.com/data/7a017a2ebda266778cbbec04e16e2f35
得到图片的地址。http://img3.hao123.com/data/9f110259c7b6734ebe7e307b1b912c46
得到图片的地址。http://img.hao123.com/data/e56ee63ec0ae68a86e44da342f23f39e
得到图片的地址。http://img4.hao123.com/data/e8455d38d150cf1c3d4f445d4032aed0
得到图片的地址。http://img.hao123.com/data/6fedaee8c5c431f8251296ef490c0cb4电影名。黄金大劫案
电影名。逆战
电影名。喜羊羊与灰太狼之开心闯龙年
电影名。暮光之城
电影名。奋斗
电影名。敢死队
电影名。僵尸先生
电影名。济公
电影名。复仇者之死
电影名。孤岛惊魂
电影名。让子弹飞
电影名。英雄
电影名。绣花鞋演员 雷佳音 / 陶虹 / 程媛媛
演员 周杰伦 / 谢霆锋 / 林鹏
演员 祖丽晴 / 张琳 / 梁颖
演员 罗伯特·帕丁森 / 克里斯
演员 李晨 / 董璇 / 郑恺
演员 李连杰 / 西尔维斯特·史泰龙 / 杰森·斯坦森
演员 林正英 / 黄虾 / 钱小豪
演员 周星驰 / 张曼玉 / 吴孟达
演员 麦浚龙 / 苍井空 / 刘永
演员 陈小春 / 杨幂 / 叶山豪
演员 葛优 / 姜文 / 刘嘉玲
演员 李连杰 / 梁朝伟 / 张曼玉
演员 林心如 / 莫小棋 / 叶熙祺
演员 米歇尔·塞罗 / 柯莱儿·布翁尼许 / 米歇尔.塞罗
演员 吴镇宇 / 黎姿 / 海俊杰时间 2012
时间 2012
时间 2012
时间 2008
时间 2011
时间 2010
时间 1985
时间 1993
时间 2010
时间 2011
时间 2010
时间 2002类型 动作 喜剧 剧情 爱情 战争
类型 动作 剧情 惊悚
类型 喜剧 剧情 动作
类型 爱情 剧情 惊悚 科幻 动作
类型 爱情 喜剧 剧情
类型 动作 剧情 惊悚
类型 恐怖 喜剧 动作
简介一个小混混在阴差阳错间卷进一桩劫金大案,生死命悬一线,疯狂一触即发。为了八吨神秘黄金,混世小太岁、金镖十三郎、满洲第一影后、代庖神父、富家千金,各类人物粉墨登场;日本侵略军、外国公使、野鸡军团、神秘剧组、黑心包租婆,各方势力虎视眈眈。谁敌谁友?谁明谁暗?谁生谁死? 在一个重兵把守,炮弹都炸不开的金库里,八吨黄金如何被劫走,成为最大悬念。
简介从小与母亲相依为命的国际安全局警察万飞 (周杰伦 饰) 深入军事重地中东进行任务,枪林弹雨中发生意外,同僚兼未婚妻Ice (白冰 饰)当场身亡,万飞亦身受重伤,留下随时送命的后遗症。 万飞感到时日不多,便离队返家陪伴母亲。母亲于此时将隐藏多年的秘密告诉万飞,为了完成母亲心愿,他决定远赴东南亚,途中结识了医疗队义工Rachel (林鹏 饰)。没想到Rachel被卷入一个国际犯罪集团的惊世阴谋,万飞挺身相救,多次的炮火追逐令他们的生命受到严重威胁,更发现其中一名敌人竟是万飞的亲生哥哥万阳 (谢霆锋 饰)!岂料组织为了利益而出卖万阳,同时绑架了他的女儿!为了救出女儿及Rachel,两兄弟决定连手对付敌人。究竟万阳的女儿及Rachel能否逃出生天?万飞与万阳两兄弟之间的误解及羁绊又如何化解?
简介传言,幽幽山谷中,藏有千年绝世珍宝——“龙笛”。只有真正的龙的传人才能开启宝藏的密室之门……云朵坠地,飓风骤降,青青草原陷入一片混沌,这一切与龙世界正遭遇的灭顶之灾息息相关,而终结灾难的唯一办法就是吹响传说中的“龙笛”……于是,“羊羊战队”再度集结,决定前往这个神秘而 又未知的国度一探究竟!另一边,得悉灾难降临而举家落跑的灰太狼被一阵突如其来的怪浪卷入龙世界,不得不再度与众羊并肩作战……“叮叮”,“咚咚”,“铛铛”,山谷里传来阵阵刺耳的声响,仔细一瞧,竟是喜羊羊与灰太狼他们在拜师学“艺”。要想成为龙的传人,必须经过九九八十一关考试,有音乐、有功夫、有学识……龙堡内,最后的决战一触即发。机械龙的强大远超乎众人的想象,原本犀利的武器变得不堪一击。当沸羊羊命悬一线时,一阵悠扬的笛声响彻云霄,一个小小的身影从“机械龙”中缓缓走来……喜羊羊、灰太狼能否顺利过关,穿上圣龙盔甲?谁又是深不可测的“终极大Boss”?一切谜底尽在大电影《喜羊羊与灰太狼之开心闯龙年》!
而我想要的结果如下:(这个是我,直接规定了电影名字,所以才 对应查找到了它的链接地址,类型等。。信息的。。)得到的视频连接地址====优酷:http://v.youku.com/v_show/id_XMjM5OTE4OTQ0.html
得到的视频连接地址====新浪:http://video.sina.com.cn/m/rzdf_61241467.html
得到的视频连接地址====奇艺:http://www.iqiyi.com/dianying/20110208/c400871a16e3fc1b.html
得到的视频连接地址====乐视:http://www.letv.com/ptv/pplay/26040/1.html
得到的视频连接地址====m1905:http://www.m1905.com/vod/play/418667.shtml
得到的视频连接地址====搜狐:http://tv.sohu.com/20110208/n279242742.shtml
得到的视频连接地址====酷6:http://v.ku6.com/film/index_128479.html
得到的视频连接地址====腾讯:http://v.qq.com/cover/t/t2o9d4ze36zn8r5.html
得到的视频连接地址====土豆:http://www.tudou.com/albumplay/Hl_EJuiKR7k.html
得到图片的地址。http://img.hao123.com/data/a74ee6de6e3e35ef6bc388cb7263b634
演员 葛优 / 姜文 / 刘嘉玲
时间 2010
类型 动作 剧情 喜剧
简介民国年间,花钱捐得县长的马邦德(葛优 饰)携妻(刘嘉玲 饰)及随从走马上任。途经南国某地,遭劫匪张麻子(姜文 饰)一伙伏击,随从尽死,只夫妻二人侥幸活命。马为保命,谎称自己是县长的汤师爷。为汤师爷许下的财富所动,张麻子摇身一变化身县长,带着手下赶赴鹅城上任。有道是天高皇帝远,鹅城地处偏僻,一方霸主黄四郎(周润发 饰)只手遮天,全然不将这个新来的县长放在眼里。张麻子痛打了黄的武教头(姜武 饰),黄则设计害死张的义子小六(张默 饰)。原本只想赚钱的马邦德,怎么也想不到竟会被卷入这场土匪和恶霸的角力之中。鹅城上空愁云密布,血雨腥风在所难免…… 本片根据马识途的小说《夜谭十记》中的《盗官记》一章改编代码如下:(但是我不可能这样写电影名字的啊所以不知道怎么才能对电影名查找信息)Elements  address= doct.select("li[ptitle^=让子弹飞]").select("[class^=provide]").select("a[href]");

 for (Element element : address) {
 String href=element.attr("href");
 String text=element.text();
 String links= text+":"+href;
 System.out.println("得到的视频连接地址===="+links);//
 
}

 Elements pic= doct.select("li[ptitle^=让子弹飞]").select("span.image").select("img[src]");// 所有引用 png 图片的元素   span.image是  <span class="image"> 标签 class 为image的
 for (Element element : pic) {
 String src=element.attr("src");
//Downloadpic.picture(src);
System.out.println("得到图片的地址。"+src);

}
 Elements actor= doct.select("li[ptitle^=让子弹飞]").select("[class^=twocol-wrapper]").select("[class^=player]");
 for (Element element1 : actor) {
String text1= element1.text();
String movieactor = text1.substring(3,text1.length());
System.out.println("演员"+movieactor);
}
 
 Elements time= doct.select("li[ptitle^=让子弹飞]").select("[class^=year]");//时间
 for (Element element2 : time) {
String text2=element2.text();
String movieyear = text2.substring(3,text2.length());
System.out.println("时间"+movieyear);
}
 Elements type= doct.select("li[ptitle^=让子弹飞]").select("[class^=type]");//类型
 for (Element element3 : type) {
String text3=element3.text();
String movietype = text3.substring(3,text3.length());
System.out.println("类型"+movietype);
}
 Elements jianjie= doct.select("li[ptitle^=让子弹飞]").select("[class^=intro]").select("i[style]");//类型
 for (Element element4 : jianjie) {
String text4=element4.text();
System.out.println("简介"+text4);
}

解决方案 »

  1.   


    for (int i = 1; i <2 ; i++) {//1147
    String path = "http://v.hao123.com/movie/index/pn-"+i+"-px-fyb#movie-body";}
    这个网站总共有 1147页  可以组合它的地址,解析出来每一页的,先看一下第二页的吧
    http://v.hao123.com/movie/index/pn-2-px-fyb#movie-body
      

  2.   


    由于:
     Elements actor= doct.select("li[ptitle^=让子弹飞]").select("[class^=twocol-wrapper]").select("只是放一个名字,就可以对应解析出来 对应电影的相关信息,所以  我试了 先解析到这个网页具有的所有电影名,然后把  li[ptitle^=让子弹飞] 改成了  得到电影名的 变量,比如 :String text = element.attr("alt"); 然后我就  将 li[ptitle^=让子弹飞] 改成  li[ptitle^=text ]
    但是  li[ptitle^=让子弹飞]  是在   doct.select("li[ptitle^=让子弹飞]") 中放置的,有"" 所以 text 变量传不进去