何谓大规模并发,不同层面有不同的理解

企业应用(Intranet):千级强并发,万级弱并发(在线用户),十万级用户

 

  •     大型企业ERP、供应链,大型企业HR、办公OA

互联网应用(Internet):百万级强并发,千万级弱并发(在线用户),亿级用户/

  • 门户网站(新浪、腾讯)
  • 平台级电子商务(阿里巴巴、淘宝网、拍拍网)
  • 搜索引擎(百度)

电子商务企业应用(Intranet + Internet):十万级强并发,百万级弱并发(在线用户),千万级用户

  • B2C电子商务(京东、凡客、一号店)
  • 垂直型电子商务(金银岛、携程)

不同系统间的并发特点
企业系统
大量事务性、实时性访问

  • 大量的事务、锁检测导致数据库访问瓶颈
  • 需要数据操作的实时更新

大量有状态性访问


  • 数据访问具有较强的操作上下文
  • 数据一致性、准确性的高敏感
  • 数据每一次事务性更新都必须得到充分展现,并且确保数据访问的一致性

清晰的业务逻辑进行并发划分


  • 一般来说,企业系统都可以进行明确的业务区分,从而决定系统特点


互联网系统


海量非事务性访问


  • 极其巨大的数据量及数据访问导致IO操作成为瓶颈

模糊的并发区分


  • 并发访问的用户中很难通过内容进行有效分发
  • 并发访问一般具有地域性

数据访问效率的高敏感


  • 用户对系统的响应时间非常敏感,需要在几秒内得到信息反馈
  • 用户更加在意数据的匹配性


电子商务系统


数据实时性的高敏感


价格、信息同步的一致性等


受制于企业级系统的约束


  • 如支付,受事务性影响

海量非事务性访问+一定规模事务性访问


信息访问具有互联网系统特点、信息操作具有企业系统特点


  • 如数据的搜索查询、展现具有互联网系统特点
  • 如数据的操作(支付、结算)具有企业系统事务性特点


什么是性能问题


  • 在可识别的压力下,系统无法提供服务 (最差的性能问题)
  • 在可识别的压力下,系统无法按服务质量标准提供服务 (满足性能标准,但是健壮性不足)
  • 在可识别的压力下,系统无法持续按服务质量标准提供服务 (系统的可靠性和健壮性)
  • 在超过识别的压力下,系统无法尽快恢复
  • 能否有故障转移、故障恢复、冗余热备等机制
  • 在超过识别的压力下,系统无法柔性伸缩 (系统的可伸缩性)

什么不是性能问题


  • 超过可识别的压力情况下,系统暂时无法有效提供服务


性能测量


服务质量


  • 网络响应:网络响应时间、网络吞吐量、网络带宽及带宽利用率
  • 服务响应时间:包括平均、峰值、标准区间值
  • 服务处理质量:事务成功率、单位时间响应事务次数

服务端设备状态


  • CPU:CPU使用率
  • 内存:使用内存大小
  • VM:GC次数(Full GC次数)、堆内存、线程数、锁和阻塞情况
  • 磁盘IO:磁盘访问效率、磁盘空间、磁盘IO吞吐量

系统可靠性、健壮性


  • 单节点处理的访问量
  • 故障恢复时间
  • 节点复制和节点扩展的难易

 

系统可能的性能瓶颈
网络

  • 网络带宽的总体限制
  • 网络连接数的限制(如TCP/IP, 数据库连接等)

服务器


  • 每个响应占用相应的资源,导致内存成为瓶颈
  • 比如JVM为每个线程分配栈空间,过多栈空间导致内存消耗
  • 比如每个HTTP连接在Session存储内容,导致OOME
  • 同时响应一定量的并发操作,导致CPU占用过高

磁盘IO


  • 频繁访问数据库,导致数据交换IO操作频繁
  • 频繁访问IO文件,导致磁盘IO成为瓶颈


企业级系统架构及技术特点


架构设计


基于SOA和MDA的架构


  • 以服务为核心单元的 设计思想,以传统WS作为服务发布
  • 以模块化为系统构建方式,重视应用子系统和子模块的独立性和可重用性

中央集中式部署架构


  • 专业小型服务器
  • 一般不会超过5台部署服务器,不会多于10个应用节点
  • 热备和故障恢复机制、灾备系统

关注流程


  • 工作流技术,尤其是分布式节点间流程整合
  • 企业系统间的无缝转移

门户


  • 跨系统,跨节点间的单点登录


技术运用


以商业性产品为主


  • 追求单节点稳定性
  • 较少需要7*24小时支持
  • 以商业性关系数据库为主要存储

比较严格的事务性访问


  • 完全基于数据库事务
  • 分布式事务(JTA)

较为复杂并且功能丰富的用户界面


  • 用户具有相对统一的客户端(比如使用IE浏览器)
  • 用户可以接受适当的响应和延迟

 

互联网系统架构及技术特点
架构设计
以界面展现和用户体验为主要设计

  • 大量运用Ajax实现局部提交和局部刷新

以轻量级、伸缩性为架构主要考虑


  • 除某些平台级应用外,极少使用服务扩展
  • 使用REST风格的WebService或者纯粹的处理Json的Web响应
  • 数以百台甚至上万台PC服务器,多个数据中心,站点镜像
  • 分布式独立域以及部署域之间定时通信

高性能缓存机制


  • 双向页面缓存
  • 内容静态化技术
  • 数据缓存

非事务、非关系型数据库


  • 全面NoSQL数据库


技术运用


大量使用开源技术产品


  • LAMP: Linux + Apache + MySQL + PHP
  • Tomcat, Lucene, Memcache

简单界面开发技术


  • 脚本语言,如PHP, Python, Ruby等
  • 对多种浏览器的支持

底层高性能处理优化


  • 使用C、C++实现底层通信和IO优化


电子商务系统架构及技术特点


架构设计


关注数据的糅合(Mashup)


关系数据库与高性能NoSQL数据库结合


不固定的架构设计思路


  • 可能偏互联网方向,也可能偏企业系统方向
  • 分布式部署

事务缓存机制


  • 事务迁移、事务恢复、事务批量处理

较为严格的安全机制


  • 部分功能使用HTTPS及数字证书

与企业系统的对接交互


  • 与银行、支付平台的对接
  • 与企业订单系统、进销存系统、物流系统的对接


技术运用


有时效的缓存机制


  • 确保数据实时性与性能的平衡

大量数据挖掘和分析运用


  • 相关性分析
  • 定向推荐

部分运用商业中间件技术产品


  • 应用服务器
  • 业务流程管理

大量的开源技术运用


  • Java相关开源技术比较常见