GTD2020-05-31 icon indicating copy to clipboard operation
GTD2020-05-31 copied to clipboard

NiuTrans/MTBook: 《机器翻译:统计建模与深度学习方法 (第二版)》肖桐 朱靖波 著 - Machine Translation: Statistical Modeling and Deep Learning Methods (2nd Version)

Open kunpeng9 opened this issue 3 years ago • 0 comments

机器翻译:统计建模与深度学习方法 (第二版)

Machine Translation: Statistical Modeling and Deep Learning Methods (2nd Version)

作者:肖桐 (Tong Xiao) 朱靖波 (Jingbo Zhu)

单位:东北大学自然语言处理实验室 (NEUNLPLab) / 小牛翻译 (NiuTrans Research)

顾问:姚天顺 (Tianshun Yao) 王宝库 (Baoku Wang)

网站:https://opensource.niutrans.com/mtbook/index.html

GitHub:https://github.com/NiuTrans/MTBook

☀️ 谢谢大家的关注,我们对内容进行了重构和修改,现在是第二版了! 😁

这是一个教程,目的是对机器翻译的统计建模和深度学习方法进行较为系统的介绍。其内容被编纂成书,可以供计算机相关专业高年级本科生及研究生学习之用,亦可作为自然语言处理,特别是机器翻译相关研究人员的参考资料。本书用 tex 编写,所有源代码均已开放。

本书共分为四个部分,每部分由若干章节组成,章节的顺序参考了机器翻译技术发展的时间脉络,同时兼顾了机器翻译知识体系的内在逻辑。各部分的主要关系如下(如果无法显示图片可以稍后再试):

内容

封面、前言和目录

Part I 机器翻译基础

  1. 机器翻译简介
  1. 统计语言建模基础
  1. 词法分析和语法分析基础
  1. 翻译质量评价

Part II 统计机器翻译

  1. 基于词的机器翻译建模
  1. 基于扭曲度和繁衍率的模型
  1. 基于短语的模型
  1. 基于句法的模型

Part III 神经机器翻译

  1. 人工神经网络和神经语言建模
  1. 基于循环神经网络的模型
  1. 基于卷积神经网络的模型
  1. 基于自注意力的模型

Part IV 机器翻译前沿

13-18 进行中...

Part V 附录

参考文献

索引

注:本书的 pdf 版本可以从 GitHub 仓库获取https://github.com/NiuTrans/MTBook/blob/master/mt-book.pdf

源代码

本书的 tex 源代码地址为:https://github.com/NiuTrans/MTBook

编译前需要安装MikTeX,并在 MikTeX Console 中下载并更新编译所需宏包。之后,编译 src 目录下的 mt-book-xelatex.tex 即可得到 pdf 文件,编译指令如下:

xelatex mt-book-xelatex
biber mt-book-xelatex
makeindex mt-book-xelatex
xelatex mt-book-xelatex

在编译中可能会遇到内存不足的问题,可以通过以下方式解决:

Windows 下使用 MiKTeX 或 CTEX

  1. 运行 cmd 打开命令行窗口,输入:initexmf --edit-config-file=xelatex
  2. 在弹出的文件中输入以下内容:main_memory=5000000 extra_mem_bot=5000000 font_mem_size=5000000 pool_size=5000000 buf_size=5000000
  3. 在 cmd 窗口输入: initexmf --dump=xelatex 更新 latex 格式文件

TeXLive & MacTeX(Linux,OS X 等)

  1. 打开 texmf.cnf 文件,更改其内容为:main_memory=5000000 extra_mem_bot=5000000 font_mem_size=5000000 pool_size=5000000 buf_size=5000000
  2. 调用 texhash 更新 latex 格式文件

注:编译 tex 文件会依赖一些宏包。如果有任何编译错误,建议将宏包更新至最新版本。

课件

本教程部分章节的课件已开放。pdf 版本的地址为https://github.com/NiuTrans/MTBook/tree/master/slides

开源协议

本书的开源内容基于 The Creative Commons Attribution-NonCommercial 4.0 Unported License(link

致谢

感谢为本书做出贡献的小牛团队(部分)成员

曹润柘、曾信、孟霞、单韦乔、周涛、周书含、许诺、李北、许晨、林野、李垠桥、王子扬、刘辉、张裕浩、冯凯、罗应峰、魏冰浩、王屹超、李炎洋、姜雨帆、田丰宁、刘继强、张哲旸、陈贺轩、刘晓倩、牛蕊、杜权、胡驰、王泽洋、刘腾博、刘兴宇、徐萍、赵闯、高博、张春良、王会珍、张俐、杨木润、宁义明、李洋、秦浩、胡明涵、马安香

联系我们

有任何问题请联系 xiaotong [at] mail.neu.edu.cn (肖桐) 或 854581319 [at] qq.com(曹润柘) https://github.com/NiuTrans/MTBook

kunpeng9 avatar Dec 02 '20 08:12 kunpeng9