OpenResty 发展起源
OpenResty(也称为 ngx_openresty)是一个全功能的 Web 应用服务器。它打包了标准的 nginx 核心,很多的常用的第三方模块,以及它们的大多数依赖项。 通过揉和众多设计良好的 nginx 模块,OpenResty 有效地把 nginx 服务器转变为一个强大的 Web 应用服务器,基于它开发人员可以使用 lua 编程语言对 nginx 核心以及现有的各种 nginx C 模块进行脚本编程,构建出可以处理一万以上并发请求的极端高性能的 Web 应用。
OpenResty 致力于将你的服务器端应用完全运行于 nginx 服务器中,充分利用 nginx 的事件模型来进行非阻塞 I/O 通信。不仅仅是和 HTTP 客户端间的网络通信是非阻塞的,与 MySQL、PostgreSQL、Memcached 以及 Redis 等众多后端之间的网络通信也是非阻塞的。 因为 OpenResty 软件包的维护者也是其中打包的许多 nginx 模块的作者,所以 OpenResty 可以确保所包含的所有组件可以可靠地协同工作。
OpenResty 最早是雅虎中国的一个公司项目,起步于 2007 年 10 月。当时兴起了 OpenAPI 的热潮,用于满足各种 Web Service 的需求,基于 Perl 和 Haskell 实现; 2009 章亦春在加入淘宝数据部门的量子团队,决定对 OpenResty 进行重新设计和彻底重写,并把应用重点放在支持像量子统计这样的 Web 产品上面,这是第二代的 OpenResty,基于 nginx 和 lua 进行开发。
为什么要取 OpenResty 这个名字呢?OpenResty 最早是顺应 OpenAPI 的潮流做的,所以 Open 取自“开放”之意,而 Resty 便是 REST 风格的意思。虽然后来也可以基于 ngx_openresty 实现任何形式的 Web service 或者传统的 Web 应用。
也就是说 nginx 不再是一个简单的静态网页服务器,也不再是一个简单的反向代理了,OpenResty 致力于通过一系列 nginx 模块,把 nginx 扩展为全功能的 Web 应用服务器,目前有两大应用目标:
- 通用目的的 Web 应用服务器。在这个目标下,现有的 Web 应用技术都可以算是和 OpenResty 或多或少有些类似,比如 Nodejs,PHP 等等,但 OpenResty 的性能更加出色。
- nginx 的脚本扩展编程,为构建灵活的 Web 应用网关和 Web 应用防火墙等功能提供了极大的便利性。
OpenResty 特性概括如下:
- 基于 nginx 的 Web 服务器
- 打包 nginx 核心、常用的第三方模块及依赖项
- 使用 lua 对 nginx 进行脚本编程
- 充分利用 nginx 的事件模型进行非阻塞 I/O 通信
- 使用 lua 以同步方式进行异步编程
- 拓展后端通信方式
综合 OpenResty 的特性,它不仅具备 nginx 的负载均衡、反向代理及传统 http server 等功能,还可以利用 lua 脚本编程实现路由网关,实现访问认证、流量控制、路由控制及日志处理等多种功能;同时利用 cosocket 拓展和后端(mysql、redis、kafaka)通信后,更可开发通用的 restful api 程序。
OpenResty 之 lua 编程
lua 简介
1993 年在巴西里约热内卢天主教大学诞生了一门编程语言,他们给这门语言取了个浪漫的名字 — lua,在葡萄牙语里代表美丽的月亮。事实证明他们没有糟蹋这个优美的单词,lua 语言正如它名字所预示的那样成长为一门简洁、优雅且富有乐趣的语言。
lua 从一开始就是作为一门方便嵌入(其它应用程序)并可扩展的轻量级脚本语言来设计,因此她一直遵从着简单、小巧、可移植、快速的原则,官方实现完全采用 ANSI C 编写,能以 C 程序库的形式嵌入到宿主程序中。luaJIT 2 和标准 lua 5.1 解释器采用的是著名的 MIT 许可协议。正由于上述特点,所以 lua 在游戏开发、机器人控制、分布式应用、图像处理、生物信息学等各种各样的领域中得到了越来越广泛的应用。其中尤以游戏开发为最,许多著名的游戏,比如 World of Warcraft、大话西游,都采用了 lua 来配合引擎完成数据描述、配置管理和逻辑控制等任务。即使像 Redis 这样中性的内存键值数据库也提供了内嵌用户 lua 脚本的官方支持。
作为一门过程型动态语言,lua 有着如下的特性:
- 变量名没有类型,值才有类型,变量名在运行时可与任何类型的值绑定;
- 语言只提供唯一一种数据结构,称为表(table),它混合了数组、哈希,可以用任何类型的值作为 key 和 value。提供了一致且富有表达力的表构造语法,使得 lua 很适合描述复杂的数据;
- 函数是一等类型,支持匿名函数和正则尾递归(proper tail recursion);
- 支持词法定界(lexical scoping)和闭包(closure);
- 提供 thread 类型和结构化的协程(coroutine)机制,在此基础上可方便实现协作式多任务;
- 运行期能编译字符串形式的程序文本并载入虚拟机执行;
- 通过元表(metatable)和元方法(metamethod)提供动态元机制(dynamic meta-mechanism),从而允许程序运行时根据需要改变或扩充语法设施的内定语义;
- 能方便地利用表和动态元机制实现基于原型(prototype-based)的面向对象模型;
- 从 5.1 版开始提供了完善的模块机制,从而更好地支持开发大型的应用程序;
lua 基础数据类型
print(type("hello world")) --> output:stringprint(type(print)) --> output:functionprint(type(true)) --> output:booleanprint(type(360.0)) --> output:numberprint(type(nil)) --> output:nil复制代码
nil
nil 是一种类型,lua 将 nil 用于表示“无效值”。一个变量在第一次赋值前的默认值是 nil,将 nil 赋予给一个全局变量就等同于删除它。
local numprint(num) --> output:nil
num = 100print(num) --> output:100复制代码
boolean (true/false)
布尔类型,可选值 true/false;lua 中 nil 和 false 为“假”,其它所有值均为“真”,比如 0 和空字符串就是“真”。
local a = truelocal b = 0local c = nilif a then
print("a") --> output:aelse
print("not a") -- 这个没有执行
endif b then
print("b") --> output:belse
print("not b") -- 这个没有执行
endif c then
print("c") -- 这个没有执行else
print("not c") --> output:not c
end复制代码
number
Number 类型用于表示实数,和 C/C++ 里面的 double 类型很类似。可以使用数学函数 math.floor(向下取整)和 math.ceil(向上取整)进行取整操作。
local order = 3.99local score = 98.01print(math.floor(order)) --> output:3print(math.ceil(score)) --> output:99复制代码
string
和其他语言 string 大同小异
local str1 = 'hello world'local str2 = "hello lua"local str3 = [["add\name",'hello']]
local str4 = [=[string have a [[]].]=]print(str1) --> output:hello worldprint(str2) --> output:hello luaprint(str3) --> output:"add\name",'hello'print(str4) --> output:string have a [[]].复制代码
table (数组、字典)
Table 类型实现了一种抽象的“关联数组”。“关联数组”是一种具有特殊索引方式的数组,索引通常是字符串(string)或者 number 类型,但也可以是除 nil 以外的任意类型的值。
local corp = {
web = "www.google.com", -- 索引为字符串,key = "web",
-- value = "www.google.com"
telephone = "12345678", -- 索引为字符串
staff = {"Jack", "Scott", "Gary"}, -- 索引为字符串,值也是一个表 100876, -- 相当于 [1] = 100876,此时索引为数字
-- key = 1, value = 100876
100191, -- 相当于 [2] = 100191,此时索引为数字
[10] = 360, -- 直接把数字索引给出
["city"] = "Beijing" -- 索引为字符串
}print(corp.web) --> output:www.google.comprint(corp["telephone"]) --> output:12345678print(corp[2]) --> output:100191print(corp["city"]) --> output:"Beijing"print(corp.staff[1]) --> output:Jackprint(corp[10]) --> output:360复制代码
在内部实现上,table 通常实现为一个哈希表、一个数组、或者两者的混合。具体的实现为何种形式,动态依赖于具体的 table 的键分布特点。
function
在 lua 中,函数也是一种数据类型,函数可以存储在变量中,可以通过参数传递给其他函数,还可以作为其他函数的返回值。
local function foo()
print("in the function")
-- dosomething()
local x = 10
local y = 20
return x + y
end
local a = foo -- 把函数赋给变量
print(a())
-- output:in the function30复制代码
lua 表达式
算术运算符 | 说明 | 关系运算符 | 说明 | 逻辑运算符 | 说明 |
+ | 加法 | < | 小于 | and | 逻辑与 |
- | 减法 | > | 大于 | or | 逻辑或 |
* | 乘法 | <= | 小于等于 | not | 逻辑非 |
/ | 除法 | >= | 大于等于 | - | - |
^ | 指数 | ~= | 不等于 | - | - |
% | 取模 | - | - | - | - |
note: lua 中的不等于用 ~= 表示, 和其他语言的 != 不一致
lua 流程控制
lua 的流程控制结构和 python 类似,有几个特例:
- lua 中的 elseif 需要连写,中间不能有空行;python 中写法是 elif
- lua 中没有 continue 流控
if/else/elseif
if a = 1 then print("1")elseif a == 2 then print("2")else
print("3")end复制代码
while
while a > 1 do if a == 5 then
break
end
a = a + 1end复制代码
repeat
local i = 0repeat print(i)
if i == 5 then break
end
until true复制代码
for/break
local t = { a = 1, b = 2}for k, v in pairs(t) do -- 遍历字典 print(k, v)end
local t = {1, 2}for k, v in ipairs(t) do -- 遍历整型数组 print(k, v)endfor i = 1, 10 do -- range 循环
print(i)
end复制代码
return
local function foo(arg) if arg == "" then
return nil
end
return "bar"end复制代码
OpenResty 模块编写
编写一个 access.lua 模块,源码如下:
local _M = {}
_M.check = function() if ngx.var.http_host == "foo.bar.com" then
ngx.exit(403) endendreturn _M -- 注意 return _M,返回 table 表示的模块复制代码
在 access_by_lua 的 nginx hook 中调用 access 模块:
access_by_lua_block { local rule = require "access" -- require 中不需要加 `.lua` 后缀
rule.check()
}复制代码
OpenResty 核心原理
nginx 进程模型
nginx 是一个 master + 多个 worker 进程模型;master 进程负责管理和监控 worker 进程,如加载和解析配置文件,重启 worker 进程,更新二进制文件等。 worker 进程负责处理请求,每个 worker 地位和功能相同,内部按照 epoll + callback 方式实现并发连接处理;整体架构图如下:
nginx 请求处理流程
每个 worker 进程都分阶段处理 http 请求,简单概括为初始化请求 -> 处理请求行 -> 后端交互 -> 响应头处理 -> 响应包体处理 -> 打印日志等几个阶段。其中处理响应体阶段又可以挂载多个不同的 filter。具体的请求阶段可以参见 nginx Phase, nginx 请求处理流程如下图:
nginx 事件机制
nginx 的事件驱动机制是对 epoll 驱动的封装,但其本质还是 epoll + callback 方式:
lua 协程
函数 | 描述 |
coroutine.create() | 创建 coroutine,返回 coroutine,参数是一个函数,当和 resume 配合使用的时候就唤醒函数调用 |
coroutine.resume() | 重启 coroutine,和 create 配合使用 |
coroutine.yield() | 挂起 coroutine,将 coroutine 设置为挂起状态,这个和 resume 配合使用能有很多有用的效果 |
coroutine.status() | 查看 coroutine 的状态。注:coroutine 的状态有四种:dead,suspend,running,normal |
coroutine.create(f)
创建一个主体函数为 f 的新协程。f 必须是一个 lua 的函数。返回这个新协程,它是一个类型为 "thread" 的对象,创建后并不会启动该协程。
coroutine.resume(co, [, val1, ...])
开始或继续协程 co 的运行。当第一次执行一个协程时,他会从主函数处开始运行。val1, ... 这些值会以参数形式传入主体函数。如果该协程被挂起,resume 会重新启动它;val1, ... 这些参数会作为挂起点的返回值。如果协程运行起来没有错误,resume 返回 true 加上传给 yield 的所有值 (当协程挂起),或是主体函数的所有返回值(当协程中止)。
coroutine.yield(...)
挂起正在调用的协程的执行。 传递给 yield 的参数都会转为 resume 的额外返回值。
coroutine.status(co)
以字符串形式返回协程 co 的状态:
- 当协程正在运行(它就是调用 status 的那个) ,返回 "running";
- 如果协程调用 yield 挂起或是还没有开始运行,返回 "suspended";
- 如果协程是活动的,都并不在运行(即它正在延续其它协程),返回 "normal";
- 如果协程运行完主体函数或因错误停止,返回 "dead"。
协程实例(生产者消费者)
使用协程实现生产者消费者:
local function produce()
while true do
local x = io.read()
coroutine.yield(x) -- 挂起协程
endendlocal producer = coroutine.create(produce) -- 创建协程local function receive() local status, value = coroutine.resume(producer) -- 执行协程
return valueendlocal function consumer()
while true do
local x = receive()
io.write(x, "\n") endendconsumer() -- loop复制代码
lua 与 c 堆栈交互
lua 虚拟机常嵌入 C 程序中运行,对于 C 程序来说,lua 虚拟机就是一个子进程。lua 将所有状态都保存在 lua_State 类型中,所有的 C API 都要求传入一个指向该结构的指针。我们根据这个指针来获取 lua 虚拟机(也就是子进程)的状态。
虚拟机内部与外部的 C 程序发生数据交换主要是通过一个公用栈实现的,也就是说 lua 虚拟机和 C 程序公用一个栈,双方都可以压栈或读取数据。一方压入,另一方弹出就能实现数据的交换。
在 c 中,lua 堆栈就是一个 struct,堆栈索引方式可能是正数也可能是负数,区别是:正数索引 1 永远表示栈底,负数索引 -1 永远表示栈顶。 堆栈的默认大小是 20,可以用 lua_checkstack 修改,用 lua_gettop 则可以获得栈里的元素数目。
C 调用 lua
- 在 C 中创建 lua 虚拟机
lua_State *luaL_newstate (void)复制代码
- 加载 lua 的库函数
void luaL_openlibs (lua_State *L);复制代码
- 加载 lua 文件,使用接口
int luaL_dofile (lua_State *L, const char *filename);复制代码
- 开始交互,lua 定义一个函数
function test_func_add(a, b) return a + b end复制代码
- 如果你的 lua_State 是全局变量,那么每次对堆栈有新操作时务必使用lua_settop(lua_State, -1)将偏移重新置到栈顶
- 去lua文件中取得test_func_add方法
void lua_getglobal (lua_State *L, const char *name);复制代码
- 参数压栈
lua_pushnumber复制代码
- 通过 pcall 调用
int lua_pcall (lua_State *L, int nargs, int nresults, int msg);复制代码
完整示例,先编写一个 foo.lua 文件,在文件中实现 test_func_add 方法
function test_func_add(a, b)
return a + b
end复制代码
接下来在 C 代码中调用 foo.lua:
lua_State* init_lua()
{
lua_State* s_lua = luaL_newstate(); if (!s_lua) {
printf("luaL_newstate failed!\n");
exit(-1);
}
luaL_openlibs(s_lua); return s_lua;
}bool load_lua_file(lua_State* s_lua, const char* lua_file){ if (luaL_dofile(s_lua, lua_file) != 0) {
printf("LOAD LUA %s %s\n", lua_file, BOOT_FAIL); return false;
}
printf("LOAD LUA %s %s\n", lua_file, BOOT_OK); return true;
}int proc_add_operation(lua_State* s_lua, int a, int b){
lua_settop(s_lua, -1);
lua_getglobal(s_lua, "test_func_add");
lua_pushnumber(s_lua, a);
lua_pushnumber(s_lua, b); int val = lua_pcall(s_lua, 2, 1, 0); if (val) {
printf("lua_pcall_error %d\n", val);
} return (int)lua_tonumber(s_lua, -1);
}int main() {
lua_State* s_lua =init_lua(); if (!load_lua_file(s_lua, "foo")) { return -1;
}
proc_add_operation(s_lua, 1, 2);
}复制代码
lua 调用 c
- 定义谁先实现 C 接口
#define target 300static int l_test_check_value(lua_State * l){ int num = lua_tointeger(l, -1); bool check = (num == target);
lua_pushboolean(l, check); return 1;
}复制代码
- lua 虚拟启动时候,注册加载 C 接口
lua_register(s_lua, "test_check_value", l_test_check_value);复制代码
- 在 lua 代码中调用注册的 C 接口
function test_func_check(a)
local val = test_check_value(a) return val
end复制代码