目录

  • 1. 下载安装包
  • 2. 解压,安装,启动服务
  • 2.1 解压安装包
  • 2.2 切换路径
  • 2.3 运行install.sh进行安装
  • 2.4 运行standalone.py启动服务
  • 3. 在浏览器登录
  • 3.1 登录
  • 3.2 导入数据,生成.ann文件
  • 3.3 选择需要标注的文件
  • 3.4 开始标注
  • 4. 对标注的数据结构进行配置
  • 4.1 实体添加
  • 4.2 中文设置
  • 4.3 设置颜色
  • 4.4 设置关系


1. 下载安装包

下载地址:http://brat.nlplab.org/index.html

如图所示,点击download下载:

genesis2000标注脚本下载_自然语言处理

2. 解压,安装,启动服务

2.1 解压安装包

tar xzf brat-v1.3_Crunchy_Frog.tar.gz

2.2 切换路径

cd brat-v1.3_Crunchy_Frog

2.3 运行install.sh进行安装

./install.sh

2.4 运行standalone.py启动服务

python standalone.py

在standalone.py的第63、64行可以修改ip地址和端口号,如图所示:

genesis2000标注脚本下载_启动服务_02

3. 在浏览器登录

根据设置的地址和端口号,在浏览器登录,登录后如图所示:

genesis2000标注脚本下载_自然语言处理_03

3.1 登录

鼠标移动到如图所示右上角登录,不然无法进行标注。

3.2 导入数据,生成.ann文件

将数据放在brat-v1.3_Crunchy_Frog/data路径下,可以根据自己的项目新建文件夹,如test,在路径brat-v1.3_Crunchy_Frog/data/test放入需要进行标注的数据。
文件的格式是.txt的格式。
运行如下指令,生成文件夹下与.txt同名的.ann文件:

find 文件夹名称 -name '*.txt'|sed -e 's|\.txt|.ann|g'|xargs touch

注:必须要同时有.txt和.ann文件,才能进行标注。

3.3 选择需要标注的文件

在浏览器窗口中点击tab键,选择需要标注的文件进行标注,如图所示:

genesis2000标注脚本下载_数据结构_04


选择文件,点击OK。

3.4 开始标注

选择我们需要标注的内容,如图所示,选择系统性血管炎

genesis2000标注脚本下载_genesis2000标注脚本下载_05

选择之后,界面会弹出如下的标注界面,选择Disease对系统性血管炎进行标注:

genesis2000标注脚本下载_启动服务_06


标记完之后,点击OK,标记完成,如下图所示:

genesis2000标注脚本下载_下载安装_07


标记完成之后,将鼠标移至上方蓝色处,然后点击data:

genesis2000标注脚本下载_自然语言处理_08


之后会弹出如下界面,点击OK保存,标注完毕。标注后的内容会保存在.ann文件中。

genesis2000标注脚本下载_数据结构_09

4. 对标注的数据结构进行配置

4.1 实体添加

在brat-v1.3_Crunchy_Frog路径中,打开annotation.conf文件,添加我们需要的实体名称,如图所示,这里我们添加了Disease、Drug两个实体名称。

genesis2000标注脚本下载_数据结构_10

4.2 中文设置

(注:直接在annotation.conf里添加中文实体经常会报错)

genesis2000标注脚本下载_数据结构_11


这样,在标注的时候,就可以显示中文,如下图所示:

genesis2000标注脚本下载_启动服务_12

4.3 设置颜色

在路径brat-v1.3_Crunchy_Frog路径中,打开visual.conf,找到[drawing],如图示设置颜色:

genesis2000标注脚本下载_启动服务_13

4.4 设置关系

在brat-v1.3_Crunchy_Frog路径中,打开annotation.conf文件,找到[relations],设置实体之间的关系,下图45~48行表示:

xx疾病 有 xx症状

xx疾病 推荐使用 xx药物

xx疾病 属于 xx部门

xx疾病 做了 xx检查

genesis2000标注脚本下载_下载安装_14


设置完关系之后,可以在浏览器界面,对于两个标注后的部分,可以从一端拖动到另一端,实现关系的标注,如下图所示:

genesis2000标注脚本下载_genesis2000标注脚本下载_15


**结束。**标记完成后,记得保存(怎么保存见3.4节内容)。