福建老秘 发表于 2010-7-20 19:53:36

网页采集程序(超级简单版)

<div class="syntaxhighlightercsharp" id="highlighter_267073">
<div class="bar                                                                            show">
<div class="toolbar">网页采集程序(超级简单版)</div>
<div class="toolbar">
<p><font face="Verdana">网页采集程序(超级简单版)<br/>01 protected void btn_click(object sender, EventArgs e)&nbsp; </font></p>
<p><font face="Verdana">02&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; {&nbsp; </font></p>
<p><font face="Verdana">03&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; //方法一:&nbsp; </font></p>
<p><font face="Verdana">04&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; //System.Net.WebClient wc = new System.Net.WebClient();&nbsp; </font></p>
<p><font face="Verdana">05&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; //byte[] b = wc.DownloadData("http://www.baidu.com");&nbsp; </font></p>
<p><font face="Verdana">06&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; //string html = System.Text.Encoding.GetEncoding("gb2312").GetString(b);&nbsp; </font></p>
<p><font face="Verdana">07&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; //html = html.Substring(html.IndexOf("&lt;p id=\"lg\"&gt;") + "&lt;p id=\"lg\"&gt;".Length);&nbsp; </font></p>
<p><font face="Verdana">08&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; //html = html.Substring(0, html.IndexOf("&lt;/p&gt;"));&nbsp; </font></p>
<p><font face="Verdana">09&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; //Response.Write(html);&nbsp; </font></p>
<p><font face="Verdana">10&nbsp;&nbsp;&nbsp; </font></p>
<p><font face="Verdana">11&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; //方法二:&nbsp; </font></p>
<p><font face="Verdana">12&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; //获取整个网页&nbsp; </font></p>
<p><font face="Verdana">13&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; System.Net.WebClient wc = new System.Net.WebClient();&nbsp; </font></p>
<p><font face="Verdana">14&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; System.IO.Stream sm = wc.OpenRead("http://www.baidu.com");&nbsp; </font></p>
<p><font face="Verdana">15&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; System.IO.StreamReader sr = new System.IO.StreamReader(sm, System.Text.Encoding.Default, true, 256000);&nbsp; </font></p>
<p><font face="Verdana">16&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; string html = sr.ReadToEnd();&nbsp; </font></p>
<p><font face="Verdana">17&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; sr.Close();&nbsp; </font></p>
<p><font face="Verdana">18&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; //根据规则获取想要的内容&nbsp; </font></p>
<p><font face="Verdana">19&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; html = html.Substring(html.IndexOf("&lt;p id=\"lg\"&gt;") + "&lt;p id=\"lg\"&gt;".Length);&nbsp; </font></p>
<p><font face="Verdana">20&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; html = html.Substring(0, html.IndexOf("&lt;/p&gt;"));&nbsp; </font></p>
<p><font face="Verdana">21&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Response.Write(html);&nbsp; </font></p>
<p><font face="Verdana">22&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; } <br/></font></p></div></div></div>

福建老秘 发表于 2010-7-20 20:00:03

<p><font face="Verdana">http://hereson.javaeye.com/blog/207468</font></p>
页: [1]
查看完整版本: 网页采集程序(超级简单版)