1. 论坛系统升级为Xenforo,欢迎大家测试!
    排除公告

APACHE优化-小弟论文-多PP

本帖由 youngcool2006-06-01 发布。版面名称:主机讨论

  1. youngcool

    youngcool New Member

    注册:
    2006-06-01
    帖子:
    4
    赞:
    0
    apache优化



    绪论




    Internet 是人类历史发展中的一个伟大的里程碑,它是未来信息高速公路的雏形,人类正由此进入一个前所未有的信息化社会。人们用各种名称来称呼Internet,如国际互联网络、因特网、交互网络、网际网等等,它正在向全世界各大洲延伸和扩散,不断增添吸收新的网络成员,已经成为世界上覆盖面最广、规模最大、信息资源最丰富的计算机信息网络。

    Internet 中最为被广泛使用的服务应该是WEB服务了.说起WEB服务器您首当其冲可能会想到IIS没错IIS在中国确实有很广泛的使用.不过在整个Internet最为广泛使用的则是APACHE(阿帕奇).千万别说什么美国的阿帕奇的武装战斗直升机.APACHE名字的来历是 A Patch server

    一个打着补丁的服务器.因为发展 APACHE 的这一群人以前是为另一个 Web Server CERN 做 Patch,Patch 做多了乾脆就自己发展出一套好了,所以就以APACHE. 那么我们来看一下IIS跟APACHE服务器在亚洲地区的使用率:

    下面是亚洲各国及地区Apache同iis使用比率的粗略统计数字,全球统计数字Apache和IIS分别占70% 30%。

    Rank Country Apache% IIS%

    1 Japan 73 9

    2 Indonesia 70 23

    2 Korea 70 25

    3 Global average 67 21

    4 Philippines 60 24

    4 New Zealand 60 30

    6 Pakistan 57 28

    7 Thailand 54 38

    7 Australia 54 38

    9 Taiwan 47 46

    10 Singapore 45 40

    11 Malaysia 42 51

    12 India 41 49

    13 China 35 56

    Posted by legend at 4:08 pm Filed under: Develop


    由此可见APACHE在WEB SERVER 中应用的广泛.





    优化APACHE 服务器






    第一章 收集基线



    本章讲让您更加了解APACHE , APACHE 服务器官方站点http://www.apache.org

    APACHE几乎支持所有操作系统当然也包括LINUX.


    本章 包括谐调并且优化APACHE2.0 定制APACHE服务器包括调整配置文件 ,使 WEB管理员可以更多地来从新编译源码 来使用模块. 目的是让WEB管理员能够修改编译,修改他们APACHE服务器的性能. 并且达到稳定的性能,绝不浪费硬件资源,但是如果你的网络有瓶颈.这就不是应用层来讨论的了.

    首先需要了解你服务器的性能,基线(从软件开发的角度来讲是开发文档或者源代码 ,这里的意思可以理解为性能.) 做为管理员要知道你的服务器处于一个什么样的状态,在你修改配置文档的后你要知道你所做的修改是否优化了你的服务器.所以在优化之前要了解服务器的性能.

    通过两部分来测试WEB服务器.

    1.1 吞吐量

    测试出两份不同的报告.测试的结果数值较大的为佳.

    --每一秒的请求报告:通常用第一次的数值做比较.

    --每一秒的Bits位传输:WEB服务器的带宽信息.你的带宽是否饱和.

    2.

    潜在问题

    某一时间,客户端请求被丢弃并且你的带宽量好.这是说明你的服务器已经超载.并且你的数值仍然增加.这个数值越小越好.

    第二章 WEB服务器子系统

    像其他的应用一样,运行APACHE WEB服务器同样专注,硬件设备,安全问题和性能.APACHE是一个轻量级别的服务及程序.不会开销很大的内存.不同类别的WEB服务器专注的硬件也有所不同.

    >静态页面(例如:HTML)

    a. 网络

    b. 内存

    c. CPU


    >动态内容(例如:pHP,Perl,CGI)

    a. 内存

    b. CPU

    c. 磁盘

    d. 网络

    >保证内容(确保内容完整传输)

    a. CPU

    b. 内存

    c. 磁盘

    d. 网络


    如果WEB服务器属于混合类型的服务器.则第一考虑的还应该是内存.如果你有足够大的内存每次请求就会通过Cache来加快你的硬盘访问速度.

    那么内存足够大,是否已经了解它的使用量呢以及Cache.我们需要使用工具来观察.使用root用户登陆系统

    # ksysguard

    启动系统监测工具类似于windows下的任务管理器比较简单.




    图1








    第三章 Apache 体系结构模块

    Apache2.0 支持两种体系结构模块

    > 进程-驱动体系结构模块

    进程-驱动(fork)体系结构,创建分开的进程句柄给每一个连接.每个新的进程复制原始的进程当APACHE创建一些新的子进程时.句炳会自动附加到新的进程里.






    图2






    >多线程-体系结构模块


    Apache2.0提供选项使用第二种模块,多线程体系结构根据APACHE的基础 ,改良了许多配置.

    线程在理论上为更有效率的体系结构.





    图3









    第四章 Apache V2.0 服务器的谐调性


    毫不夸张地说,MPM 的引入是Apache 2.0最重要的变化。大家知道,Apache是基于模块化的设计,而Apache 2.0更扩展了模块化设计到Web服务器的最基本功能。服务器装载了一种多道处理模块,负责绑定本机网络端口、接受请求,并调度子进程来处理请求。扩展模块化设计有两个重要好处:


    >Apache 可以更简洁、有效地支持多种操作系统;


    >服务器可以按站点的特殊需要进行自定制。

    显示如下:

    --with-mpm=MPM
    Choose the process model for Apache to use.
    MPM={beos|worker|prefork|mpmt_os2| perchild|leader|threadpool}



      上述操作用来选择要使用的进程模型,即哪种MPM模块。Beos、mpmt_os2分别是BeOS和OS/2上缺省的MPM, perchild 主要设计目的是以不同的用户和组的身份来运行不同的子进程。这在运行多个需要CGI的虚拟主机时特别有用,会比1.3版中的 SuExec 机制做得更好。leader 和 threadpool 都是基于worker的变体,还处于实验性阶段,某些情况下并不会按照预期设想的那样工作,所以 Apache官方也并不推荐使用。因此,我们主要阐述prefork和worker这两种和性能关系最大的产品级MPM ( 有关其它的MPM 详细说明,请参见Apache官方文档: http://httpd.apache.org/docs-2.0/mod/)。

      prefork的工作原理及配置

      如果不用“--with-mpm”显式指定某种MPM,prefork就是Unix平台上缺省的MPM。它所采用的预派生子进程方式也是 Apache 1.3中采用的模式。prefork本身并没有使用到线程,2.0版使用它是为了与1.3版保持兼容性;另一方面,prefork用单独的子进程来处理不同的请求,进程之间是彼此独立的,这也使其成为最稳定的MPM之一。

      若使用prefork,在make编译和make install安装后,使用“httpd -l”来确定当前使用的MPM,应该会看到 prefork.c(如果看到worker.c说明使用的是worker MPM,依此类推)。再查看缺省生成的httpd.conf配置文件,里面包含如下配置段:

    <IfModule prefork.c>;
    StartServers 5
    MinSpareServers 5
    MaxSpareServers 10
    MaxClients 150
    MaxRequestsPerChild 0
    </IfModule>;



      prefork的工作原理是,控制进程在最初建立“StartServers”个子进程后,为了满足MinSpareServers设置的需要创建一个进程,等待一秒钟,继续创建两个,再等待一秒钟,继续创建四个……如此按指数级增加创建的进程数,最多达到每秒32个,直到满足 MinSpareServers设置的值为止。这就是预派生(prefork)的由来。这种模式可以不必在请求到来时再产生新的进程,从而减小了系统开销以增加性能。

      MaxSpareServers设置了最大的空闲进程数,如果空闲进程数大于这个值,Apache会自动kill掉一些多余进程。这个值不要设得过大,但如果设的值比MinSpareServers小,Apache会自动把其调整为MinSpareServers+1。如果站点负载较大,可考虑同时加大MinSpareServers和MaxSpareServers。

      MaxRequestsPerChild设置的是每个子进程可处理的请求数。每个子进程在处理了“MaxRequestsPerChild” 个请求后将自动销毁。0意味着无限,即子进程永不销毁。虽然缺省设为0可以使每个子进程处理更多的请求,但如果设成非零值也有两点重要的好处:

      ◆ 可防止意外的内存泄漏;

      ◆ 在服务器负载下降的时侯会自动减少子进程数。

      因此,可根据服务器的负载来调整这个值。笔者认为10000左右比较合适。

      MaxClients是这些指令中最为重要的一个,设定的是Apache可以同时处理的请求,是对Apache性能影响最大的参数。其缺省值 150是远远不够的,如果请求总数已达到这个值(可通过ps -ef|grep http|wc -l来确认),那么后面的请求就要排队,直到某个已处理请求完毕。这就是系统资源还剩下很多而HTTP访问却很慢的主要原因。系统管理员可以根据硬件配置和负载情况来动态调整这个值。虽然理论上这个值越大,可以处理的请求就越多,但Apache默认的限制不能大于256。如果把这个值设为大于256,那么 Apache将无法起动。事实上,256对于负载稍重的站点也是不够的。在Apache 1.3中,这是个硬限制。如果要加大这个值,必须在“configure”前手工修改的源代码树下的 src/include/httpd.h中查找 256,就会发现“#define HARD_SERVER_LIMIT 256”这行。把256改为要增大的值(如4000),然后重新编译Apache即可。在Apache 2.0中新加入了ServerLimit指令,使得无须重编译Apache就可以加大MaxClients。下面是笔者的prefork配置段:

    <IfModule prefork.c>;
    StartServers 10
    MinSpareServers 10
    MaxSpareServers 15
    ServerLimit 2000
    MaxClients 1000
    MaxRequestsPerChild 10000
    </IfModule>;



      上述配置中,ServerLimit的最大值是20000,对于大多数站点已经足够。如果一定要再加大这个数值,对位于源代码树下server/mpm/prefork/prefork.c中以下两行做相应修改即可:

    #define DEFAULT_SERVER_LIMIT 256
    #define MAX_SERVER_LIMIT 20000



      worker的工作原理及配置

      相对于prefork,worker是2.0 版中全新的支持多线程和多进程混合模型的MPM。由于使用线程来处理,所以可以处理相对海量的请求,而系统资源的开销要小于基于进程的服务器。但是, worker也使用了多进程,每个进程又生成多个线程,以获得基于进程服务器的稳定性。这种 MPM的工作方式将是Apache 2.0的发展趋势。

      在configure -with-mpm=worker后,进行make编译、make install安装。在缺省生成的httpd.conf中有以下配置段:

    <IfModule worker.c>;
    StartServers 2
    MaxClients 150
    MinSpareThreads 25
    MaxSpareThreads 75
    ThreadsPerChild 25
    MaxRequestsPerChild 0
    </IfModule>;



      worker的工作原理是,由主控制进程生成“StartServers”个子进程,每个子进程中包含固定的 ThreadsPerChild 线程数,各个线程独立地处理请求。同样,为了不在请求到来时再生成线程,MinSpareThreads和 MaxSpareThreads设置了最少和最多的空闲线程数;而MaxClients设置了所有子进程中的线程总数。如果现有子进程中的线程总数不能满足负载,控制进程将派生新的子进程。

      MinSpareThreads和MaxSpareThreads的最大缺省值分别是75和250。这两个参数对Apache的性能影响并不大,可以按照实际情况相应调节。

      ThreadsPerChild是worker MPM中与性能相关最密切的指令。ThreadsPerChild的最大缺省值是64,如果负载较大,64也是不够的。这时要显式使用 ThreadLimit指令,它的最大缺省值是20000。上述两个值位于源码树 server/mpm/worker/worker.c中的以下两行:

    #define DEFAULT_THREAD_LIMIT 64
    #define MAX_THREAD_LIMIT 20000



      这两行对应着ThreadsPerChild和ThreadLimit的限制数。最好在configure之前就把64改成所希望的值。注意,不要把这两个值设得太高,超过系统的处理能力,从而因Apache不起动使系统很不稳定。

      Worker模式下所能同时处理的请求总数是由子进程总数乘以ThreadsPerChild值决定的,应该大于等于MaxClients。如果负载很大,现有的子进程数不能满足时,控制进程会派生新的子进程。默认最大的子进程总数是16,加大时也需要显式声明ServerLimit(最大值是20000)。这两个值位于源码树server/mpm/worker/worker.c中的以下两行:

    #define DEFAULT_SERVER_LIMIT 16
    #define MAX_SERVER_LIMIT 20000



      需要注意的是,如果显式声明了ServerLimit,那么它乘以ThreadsPerChild的值必须大于等于MaxClients,而且MaxClients必须是ThreadsPerChild的整数倍,否则Apache将会自动调节到一个相应值(可能是个非期望值)。下面是笔者的 worker配置段:

    <IfModule worker.c>;
    StartServers 3
    MaxClients 2000
    ServerLimit 25
    MinSpareThreads 50
    MaxSpareThreads 200
    ThreadLimit 200
    ThreadsPerChild 100
    MaxRequestsPerChild 0
    </IfModule>;



      通过上面的叙述,可以了解到Apache 2.0中prefork和worker这两个重要MPM的工作原理,并可根据实际情况来配置Apache相关的核心参数,以获得最大的性能和稳定性。


    :sweat:
    -----------------------------

    QQ:233333751
    开源空间站:http://www.linuxsky.cn
    *nix讨论群:2777877
     
  2. wangyu1314

    wangyu1314 New Member

    注册:
    2006-03-12
    帖子:
    52
    赞:
    0
    东拼西凑的一点,还敢让人指教?
     
  3. causeIOU

    causeIOU New Member

    注册:
    2010-09-29
    帖子:
    118
    赞:
    0
    还好做啦!