代理服务器的配置与应用(一)http://LinuxAid.com.cn bye2000本文版权由linuxAid和作者所有代理服务器
第一节 代理服务器概述
1.1什么是代理服务器
在TCP/IP网络中,传统的通信过程是这样的:客户端向服务器请求数据,服务器响应该请求,将数据传送给客户端。在引入了代理服务器以后,这一过程变成了这样:客户端向服务器发起请求,该请求被送到代理服务器;代理服务器分析该请求,先查看自己缓存中是否有请求数据,如果有就直接传送给客户端,如果没有就代替客户端向该服务器发出请求。服务器响应以后,代理服务器将响应的数据传送给客户端,同时在自己的缓存中保留一份该数据的拷贝。这样,再有客户端请求相同的数据时,代理服务器就可以直接将数据传送给客户端,而不需要再向该服务器发起请求。1.2 代理服务器的功能
一般说来,代理服务器具有以下的功能:
1.通过缓存增加访问速度
随着Internet的迅猛发展,网络带宽变得越来越珍贵。所以为了提高访问速度,好多ISP都提供代理服务器,通过代理服务器的缓存功能来加快网络的访问速度。一般说来,大多数的代理服务器都支持HTTP缓存,但是,有的代理服务器也支持FTP缓存。在选择代理服务器时,对于大多数的组织,只需要HTTP缓存功能就足够了。
通常,缓存有主动缓存被动缓存之分。所谓被动缓存,指的是代理服务器只在客户端请求数据时才将服务器返回的数据进行缓存,如果数据过期了,又有客户端请求相同数据时,代理服务器又必须重新发起新的数据请求,在将响应数据传送给客户端时又进行新的缓存。所谓主动缓存,就是代理服务器不断地检查缓存中的数据,一旦有数据过期,则代理服务器主动发起新的数据请求来更新数据。这样,当有客户端请求该数据时就会大大缩短响应时间。还需要说明的是,对于数据中的认证信息,大多数的代理服务器都不会进行缓存的。
2.提供用私有IP访问Internet的方法
IP地址是不可再生的宝贵资源,假如你只有有限的IP地址,但是需要提供整个组织的Internet访问能力,那么,你可以通过使用代理服务器来实现这一点。
3.提高网络的安全性
这一点是很明显的,如果内部用户访问Internet都是通过代理服务器,那么,代理服务器就成为进入Internet的唯一通道;反过来说,代理服务器也是Internet访问内部网的唯一通道,如果你没有做反向代理,则对于Internet上的主机来说,你的整个内部网只有代理服务器是可见的,从而大大增强了网络的安全性。1.3 代理服务器的分类及特点
通常的代理服务器分类方法,是从实现的机理分为线路层代理、应用层代理、智能线路层代理等等。在这里,我想从另外一个角度出发,把代理服务器分为传统代理服务器和透明代理服务器。
我认为有必要好好搞清楚两者的区别,只有真正明白了内在地机理,才能在遇到问题时,有章可循,才不会一头雾水,不知从何解决问题。因此,下面我们就通过具体的实例来说明。本章的写作思路来源于Paul Russell所写的IPCHAINS-HOWTO。下面所举的例子也来源于该文章,我觉得我读该文的最大收获在于对内部网访问外部网以及外部网访问内部网的实现手段有了一个清晰的认识。当然,这里所谓的内部网是指使用私有IP的内部网络。
我们的例子都基于以下假设:
你的域名为sample.com,你的内部网(192.168.1.*)用户通过proxy.sample.com(外部接口 eth0:1.2.3.4;内部接口 eth1:192.168.1.1)的代理服务器访问Internet,换句话说,该代理服务器是唯一一台直接与Internet和内部网相连的机器。并假该设代理服务器上运行着某种代理服务器软件(如squid)。假设内部网中某一客户机为client.sample.com(192.168.1.100)。+-------------------+ 
|内部网(192.168.1.*)| eth1+--------+eth0 DDN
| +------------| proxy |<===============>Internet 
|client198.168.1.100| +--------+
+-------------------+eth0: 1.2.3.4
eth1: 198.168.1.1

解决方案 »

  1.   

    1.3.1传统代理
    在以上基础上我们做以下工作:
    1.代理服务软件被绑定到代理服务器的8080端口。
    2.客户端浏览器被配置使用代理服务器的8080端口。
    3.客户端不需要配置DNS。
    4.代理服务器上需要配置代理服务器。
    5.客户端不需要配置缺省路由。当我们在客户端浏览器中打开一个web请求,比如“http://www.linuxaid.com.cn”,这时将陆续发生以下事件:
    1.客户端使用某一端口(比如1025)连接代理服务器8080端口,请求web页面“http://www.linuxaid.com.cn”
    2.代理服务器向DNS请求“www.linuxaid.com.cn”,得到相应的IP地址202.99.11.120。然后,代理服务器使用某一端口(比如1037)向该IP地址的80端口发起web连接请求,请求web页面。
    3.收到响应的web页面后,代理服务器把该数据传送给客户端。
    4.客户端浏览器显示该页面。从www.linuxaid.com.cn的角度看来,连接是在1.2.3.4地1037端口和202.99.11.120的80端口之间建立的。从client的角度看来,连接是在192.168.1.100的1025端口和1.2.3.4的8080端口之间建立的。1.3.2 透明代理
    透明代理的意思是客户端根本不需要知道有代理服务器的存在。
    在以上基础上我们做以下工作:
    1.配置透明代理服务器软件运行在代理服务器的8080端口。
    2.配置代理服务器将所有对80端口的连接重定向到8080端口。
    3.配置客户端浏览器直接连解到Internet。
    4.在客户端配置好DNS.
    5.配置客户端的缺省网关为192.168.1.1.当我们在客户端浏览器中打开一个web请求,比如“http://www.linuxaid.com.cn”,这时将陆续发生以下事件:
    1.客户端向DNS请求“www.linuxaid.com.cn”,得到相应的IP地址202.99.11.120。然后,客户端使用某一端口(比如1066)向该IP地址的80端口发起web连接请求,请求web页面。
    2.当该请求包通过透明代理服务器时,被重定向到代理服务器的绑定端口8080。于是,透明代理服务器用某一端口(比如1088)向202.99.11.120的80端口发起web连接请求,请求web页面。
    3.收到响应的web页面后,代理服务器把该数据传送给客户端。
    4.客户端浏览器显示该页面。从www.linuxaid.com.cn的角度看来,连接是在1.2.3.4地1088端口和202.99.11.120的80端口之间建立的。从client的角度看来,连接是在192.168.1.100的1066端口和202.99.11.120的80端口之间建立的。以上就是传统代理服务器和透明代理服务器的区别所在。第二节 各种代理服务器的比较
    linux下的代理服务器软件很多,我从www.freshmeat.com(一个著名的linux软件站点)查看了一下,足有六十多个。但是被广泛应用的只有Apache、socks、squid等几个实践证明是高性能的代理软件。下面我们分别来比较一下这几个软件:2.1 Apache
    Apache是世界上用的最广泛的HTTP服务器,之所以用的最广泛,是因为它强大的功能、高效率、安全性和速度。从1.1.x版本开始,Apache开始包含了一个代理模块。用Apache作代理服务器的性能优势并不明显,不建议使用。 
    2.2 Socks
    Socks是一种网络代理协议,该协议可以让客户机通过Socks服务器获得对Internet的完全访问能力。Scoks在服务器和客户端之间建立一个安全的代理数据通道,从客户的角度看来,Scoks是透明的;从服务器的角度看来,Socks就是客户端。客户端不需要具有对Internet的直接访问能力(也就是说,可以使用私有IP地址),因为Socks服务器能够把来自于客户端的连接请求重定向到Internet。此外,Socks服务器可以对用户连接请求进行认证,允许合法用户建立代理连接。同理,Socks也能防止非授权的Internet用户访问及的内部网络。所以常常把Socks当作防火墙来使用。
    常见的浏览器如netscape、IE等可以直接使用Socks, 并且我们也可以使用socsk5的所带的client来使那些不直接支持socks的internet软件使用Socks。
    更多的资料可以参考Socks官方站点http://www.socks.nec.com。
    2.3 Squid
    对于web用户来说,Squid是一个高性能的代理缓存服务器,Squid支持FTP、gopher和HTTP协议。和一般的代理缓存软件不同,Squid用一个单独的、非模块化的、I/O驱动的进程来处理所有的客户端请求。
    Squid将数据元缓存在内存中,同时也缓存DNS查询的结果,除此之外,它还支持非模块化的DNS查询,对失败的请求进行消极缓存。Squid支持SSL,支持访问控制。由于使用了ICP(轻量Internet缓存协议),Squid能够实现层叠的代理阵列,从而最大限度地节约带宽。
    Squid由一个主要的服务程序squid,一个DNS查询程序dnsserver,几个重写请求和执行认证的程序,以及几个管理工具组成。当Squid启动以后,它可以派生出预先指定数目的dnsserver进程,而每一个dnsserver进程都可以执行单独的DNS查询,这样一来就大大减少了服务器等待DNS查询的时间。
    2.4 选择
    从上面的比较可以看出,Apache主要功能是web服务器,代理功能只不过是其一个模块而已,Socks虽然强大,但有欠灵活,因此我们着重推荐你使用Squid。下面的章节我们就一起来学习Squid激动人心的特性及相关的安装与配置。第三节 安装Squid Proxy Server3.1获取软件
    你可以通过以下途径获取该软件:
    1.从Squid的官方站点http://www.squid-cache.org下载该软件;
    2.从你的linux发行版本中获取该软件;
    通常,Squid软件包有两种:一种是源代码,下载后需要自己重新编译;可执行文件,下载后只需解压就可以使用;另一种是就是RedHat所使用的rpm包。下面我们分别讲讲这两种软件包的安装方法。3.2安装软件
    我们以目前最新的稳定版本squid-2.3.STABLEX为例。
    3.2.1rpm包的安装
    1.进入/mnt/cdrom/RedHat/RPMS
    2.执行rpm -ivh squid-2.2.STABLE4-8.i386.rpm。
    当然,我们也可以在开始安装系统的过程中安装该软件。
      

  2.   

    3.2.2 源代码包的安装
    1.从http://www.squid-cache.org下载squid-2.3.STABLE2-src.tar.gz。
    2.将该文件拷贝到/usr/local目录。
    3.解开该文件 tar xvzf squid-2.3.STABLE2-src.tar.gz。
    4.解开后,在/usr/local生成一个新的目录squid-2.3.STABLE2,为了方便用mv命令将 该目录重命名为squid mv squid-2.3.STABLE2 squid;
    5.进入squid cd squid
    6.执行./configure 可以用./confgure --prefix=/directory/you/want指定安装目录
    系统缺省安装目录为/usr/local/squid。
    7.执行 make all
    8.执行 make install
    9.安装结束后,squid的可执行文件在安装目录的bin子目录下,配置文件在etc子目录下。第四节 配置squid基础篇——让代理服务器跑起来
    由于RedHat各方面的优势(包括易用性,稳定性等等),全世界范围内使用该发行版的用户比较多,所以,我们下面的说明都是以RedHat6.1环境下squid-2.2.STABLE4-8版本为主。从我的使用经验看来,该版本的squid要比其他版本稳定的多,以前的1.1.22版本也比较稳定,但是在功能及灵活性方面有所欠缺。
    squid有一个主要的配置文件squid.conf,在RedHat环境下所有squid的配置文件位于/etc/squid子目录下。4.1常用的配置选项
    因为缺省的配置文件有问题,所以我们必须首先修改该配置文件的有关内容,以便让squid跑起来。
    下面我们来看一看squid.conf文件的结构以及一些常用的选项:
    squid.conf配置文件的可以分为十三个部分,这十三个部分分别是:
    1.NETWORK OPTIONS (有关的网络选项)
    2.OPTIONS WHICH AFFECT THE NEIGHBOR SELECTION ALGORITHM (作用于邻居选择算 法的有关选项)
    3.OPTIONS WHICH AFFECT THE CACHE SIZE (定义cache大小的有关选项)
    4.LOGFILE PATHNAMES AND CACHE DIRECTORIES (定义日志文件的路径及cache的目录)
    5.OPTIONS FOR EXTERNAL SUPPORT PROGRAMS (外部支持程序选项)
    6.OPTIONS FOR TUNING THE CACHE (调整cache的选项)
    7.TIMEOUTS (超时)
    8.ACCESS CONTROLS (访问控制)
    9.ADMINISTRATIVE PARAMETERS (管理参数)
    10.OPTIONS FOR THE CACHE REGISTRATION SERVICE (cache注册服务选项)
    11.HTTPD-ACCELERATOR OPTIONS (HTTPD加速选项)
    12.MISCELLANEOUS (杂项)
    13.DELAY POOL PARAMETERS (延时池参数)
    虽然squid的配置文件很庞大,但是如果你只是为一个中小型网络提供代理服务,并且只准备使用一台服务器,那么,你只需要修改配置文件中的几个选项。这些几个常用选项分别是:1.http_port
    说明:定义squid监听HTTP客户连接请求的端口。缺省是3128,如果使用HTTPD加速模式 则为80。你可以指定多个端口,但是所有指定的端口都必须在一条命令行上。2.cache_mem (bytes)
    说明:该选项用于指定squid可以使用的内存的理想值。这部分内存被用来存储以下对象 :
    In-Transit objects (传入的对象)
    Hot Objects (热对象,即用户常访问的对象)
    Negative-Cached objects (消极存储的对象)
    需要注意的是,这并没有指明squid所使用的内存一定不能超过该值,其实,该选项只 定义了squid所使用的内存的一个方面,squid还在其他方面使用内存。所以squid实际 使用的内存可能超过该值。缺省值为8MB。3.cache_dir Directory-Name Mbytes Level-1 Level2
    说明:指定squid用来存储对象的交换空间的大小及其目录结构。可以用多个cache_dir命令来定义多个这样的交换空间,并且这些交换空间可以分布不同的磁盘分区。"directory "指明了该交换空间的顶级目录。如果你想用整个磁盘来作为交换空间,那么你可以将该目录作为装载点将整个磁盘mount上去。缺省值为/var/spool/squid。“Mbytes”定义了可用的空间总量。需要注意的是,squid进程必须拥有对该目录的读写权力。“Level-1”是可以在该顶级目录下建立的第一级子目录的数目,缺省值为16。同理,“Level-2”是可以建立的第二级子目录的数目,缺省值为256。为什么要定义这么多子目录呢?这是因为如果子目录太少,则存储在一个子目录下的文件数目将大大增加,这也会导致系统寻找某一个文件的时间大大增加,从而使系统的整体性能急剧降低。所以,为了减少每个目录下的文件数量,我们必须增加所使用的目录的数量。如果仅仅使用一级子目录则顶级目录下的子目录数目太大了,所以我们使用两级子目录结构。
    那么,怎么来确定你的系统所需要的子目录数目呢?我们可以用下面的公式来估算。
    已知量:
    DS = 可用交换空间总量(单位KB)/ 交换空间数目
    OS = 平均每个对象的大小= 20k
    NO = 平均每个二级子目录所存储的对象数目 = 256未知量:
    L1 = 一级子目录的数量
    L2 = 二级子目录的数量计算公式:
    L1 x L2 = DS / OS / NO
    注意这是个不定方程,可以有多个解。4.acl
    说明:定义访问控制列表。
    定义语法为:
    acl aclname acltype string1 ...
    acl aclname acltype "file" ...
    当使用文件时,该文件的格式为每行包含一个条目。
    acltype 可以是 src dst srcdomain dstdomain url_pattern urlpath_pattern time port proto method browser user 中的一种。
    分别说明如下:
    src 指明源地址。可以用以下的方法指定:
    acl aclname src ip-address/netmask ... (客户ip地址)
    acl aclname src addr1-addr2/netmask ... (地址范围)
    dst 指明目标地址。语法为:
    acl aclname dst ip-address/netmask ... (即客户请求的服务器的ip地址)
    srcdomain 指明客户所属的域。语法为:
    acl aclname srcdomain foo.com ... squid将根据客户ip反向查询DNS。
    dstdomain 指明请求服务器所属的域。语法为:
    acl aclname dstdomain foo.com ... 由客户请求的URL决定。 
    注意,如果用户使用服务器ip而非完整的域名时,squid将进行反向的DNS解析来确 定其完整域名,如果失败就记录为“none”。
    time 指明访问时间。语法如下: 
    acl aclname time [day-abbrevs] [h1:m1-h2:m2][hh:mm-hh:mm]
    day-abbrevs:
    S - Sunday
    M - Monday
    T - Tuesday
    W - Wednesday
    H - Thursday
    F - Friday
    A - Saturday
    h1:m1 必须小于 h2:m2,表达示为[hh:mm-hh:mm]。
    port 指定访问端口。可以指定多个端口,比如:
    acl aclname port 80 70 21 ...
    acl aclname port 0-1024 ... (指定一个端口范围)
    proto 指定使用协议。可以指定多个协议: 
    acl aclname proto HTTP FTP ...
    method 指定请求方法。比如:
    acl aclname method GET POST ...5.http_access
    说明:根据访问控制列表允许或禁止某一类用户访问。
    如果某个访问没有相符合的项目,则缺省为应用最后一条项目的“非”。比如最后一条为允许,则缺省就是禁止。所以,通常应该把最后的条目设为"deny all" 或 "allow all" 来避免安全性隐患。4.2 应用实例
    假想情景:某公司用squid作代理服务器,该代理服务器配置为PII450/256M/8.4G,公司所用ip段为1.2.3.0/24,并且想用8080作为代理端口。
    则相应的squid配置选项为:
    1.http_port 
    http_port 80802.cache_mem
    思路:由于该服务器只提供代理服务,所以该值可以尽量设得大一些。
    cache_mem 194M 3.cache_dir Directory-Name Mbytes Level-1 Level2
    思路:硬盘为8.4G的,在安装系统时应该做好规划,为不同的文件系统划分可用空间。在本例中,我们可以这样来划分:
    /cache1 3.5G
    /cache2 3.5G
    /var 400M
    swap 127M
    / 剩余部分
    并且,在安装时,我们尽量不安装不必要的包。这样在节约空间的同时可以提高系统的安全性和稳定性。下面我们来计算所需的第一级和第二级子目录数。
    已知量:
    DS = 可用交换空间总量(单位KB)/ 交换空间数目=7G/2=3500000KB
    OS = 平均每个对象的大小= 20k
    NO = 平均每个二级子目录所存储的对象数目 = 256未知量:
    L1 = 一级子目录的数量
    L2 = 二级子目录的数量计算公式:
    L1 x L2 = DS / OS / NO=3500000/20/256=684
    我们取
    L1=16
    L2=43
    所以,我们的cache_dir语句为:
    cache_dir /cache1 3500M 16 43
    cache_dir /cache2 3500M 16 43
      

  3.   

    SyGate在ADSL虚拟拨号环境下的应用经验
    http://www.yesky.com/20011024/201986.shtml
    sygate的所有的设置方法
    http://www.cnitsc.com/adsl/share/nat/sygate.htm
    注意
    http://arllic.myetang.com/tutor/netware/sygate002.htm
    http://arllic.myetang.com/tutor/netware/sygate003.htm
    http://xinjixi.myetang.com/proxy/s8.htm还有最重要的一点
    sygate要4.0上以后才能代理ADSLwinroute 设置大全
    http://www.csdn.net/Expert/TopicView1.asp?id=752274
    wingate设置大全
    http://www.csdn.net/Expert/TopicView1.asp?id=749898
    isaserver2000设置
    http://www.csdn.net/Expert/TopicView1.asp?id=772211
      

  4.   

    SyGate在ADSL虚拟拨号环境下的应用经验
    http://www.yesky.com/20011024/201986.shtml
    sygate的所有的设置方法
    http://www.cnitsc.com/adsl/share/nat/sygate.htm
    注意
    http://arllic.myetang.com/tutor/netware/sygate002.htm
    http://arllic.myetang.com/tutor/netware/sygate003.htm
    http://xinjixi.myetang.com/proxy/s8.htm还有最重要的一点
    sygate要4.0上以后才能代理ADSLwinroute 设置大全
    http://www.csdn.net/Expert/TopicView1.asp?id=752274
    wingate设置大全
    http://www.csdn.net/Expert/TopicView1.asp?id=749898
    isaserver2000设置
    http://www.csdn.net/Expert/TopicView1.asp?id=772211
      

  5.   

    ISA 功能更强大,不过对资源的消耗也是很惊人的。
      

  6.   

    用wingate,但是速度会慢下来很多,具体设置就自己看一下帮助好了,也没有太多东西,设置好以后其他机器都要用装wingate的机器作为代理,而且可以限制时段,端口!