docx文件转换成docjava_latex


当然也可以选择在线的编辑软件

Overleaf在线Latex编辑器

。包含很多学术论文的模板,也可以多人协同编辑,类似于腾讯在线文档编辑器。


docx文件转换成docjava_ocr_02

docx文件转换成docjava_docx文件转换成docjava_03


✨使用步骤

🌿找期刊或者会议对应的Latex模板

 

docx文件转换成docjava_ocr_04


🎄几个快捷键说明

对应跳转–Texstudio编辑左右快速对应起来需要摁住Ctrl,然后点击对应位置,就能跳转到鼠标点击的位置。overleaf是直接双击右侧对应文本就可以跳转到左侧对应代码地方。
多行注释–Texstudio编辑中使用Ctrl + T对多行文本进行注释,因为换文字的时候需要删掉之前的文本,很多时候不建议直接删除,而是将其注释掉,防止后面修改了报错无法返回的问题。


🎄 解压文件熟悉模板

解压之后可以看到如下文件,选择我们需要的模板(res2net_article.tex)先运行一下。

docx文件转换成docjava_ocr_05

docx文件转换成docjava_latex_06


熟悉模板是很重要的一步,需要知道模板左右对应位置的书写要求,比如文中Fig4的使用方式,调用了哪些命令实现了展示的效果


docx文件转换成docjava_excel_07

\CheckRmv{
\begin{figure*}[t]
  \centering
  \small
  \renewcommand{\arraystretch}{0.5}
  \setlength{\tabcolsep}{0.2mm}
  \begin{tabular}{cccccccc}
   \rotatebox[origin=l]{90}{~~~~~ResNet-50}&
   \addFig{baseball_27_resnet_0_15127}&
    \addFig{king_penguin_3_resnet_0_61341}&
    \addFig{ice_cream_45_resnet_0_47622}&
   \addFig{bulbul_13_resnet_0_53479}&
    \addFig{Greater_Swiss_Mountain_dog_44_resnet_0_67869}&
   \addFig{ballpoint_25_resnet_0_10143}&
   \addFig{mosque_6_resnet_0_45989}
   \\
   \rotatebox[origin=l]{90}{~~~~~Res2Net-50}&
   \addFig{baseball_27_res2net_0_92553}&
   \addFig{king_penguin_3_res2net_0_99834}&
  \addFig{ice_cream_45_res2net_0_80615}&
   \addFig{bulbul_13_res2net_0_87548}&
   \addFig{Greater_Swiss_Mountain_dog_44_res2net_0_96106} &
   \addFig{ballpoint_25_res2net_0_46948}&
   \addFig{mosque_6_res2net_0_94659}
   \\
   &Baseball & Penguin & Ice cream & Bulbul & Mountain dog & Ballpoint & Mosque \\
  \end{tabular}
  \caption{Visualization of class activation mapping \cite{selvaraju2017grad},
  	using ResNet-50 and Res2Net-50 as backbone networks.}
  \label{fig:cam}
\end{figure*}
}

以上面这段展示表格的代码为例,说明怎么熟悉模板。首先最外层使用了一个自定义的函数 \CheckRmv,下面是开始一个图,\begin{figure*},figure右上角的*代表要跨两栏展示,接下来是控制图居中和尺寸的命令 \centering\small,然后是开始一个表格 \begin{tabular}{cccccccc},其中c的个数代表有多少列,添加旋转90度的文字,之后添加图片 \addFig{baseball_27_resnet_0_15127},其中 baseball_27_resnet_0_15127就是图片的名字,如果我们将要使用这个图模板,只需要将图片的名字换成自己论文的图片名字。这里的图片名字并没有.jpg或者.png的图片类型标识,是因为论文中使用的都是pdf格式的图片,直接写名字即可。\caption\label分别是增加图标题和增加引用标签,方便直接引用图。


🌿分段替换

熟悉完模板之后就是替换自己论文,因为由Latex得到PDF都需要运行通过才能生成,每次替换一段就尽量运行一下,防止替换过多之后运行报错找不到问题,所以需要分段替换。分段替换、分段替换、分段替换很重要! 保证自己的在运行报错,无法得到PDF的情况下撤销上一步操作能得到运行正常的PDF。接下来找一篇论文,进行替换操作的详细说明。继续使用程明明老师的一篇顶刊工作:MobileSal: Extremely Efficient RGB-D Salient Object Detection, Yu-Huan Wu, Yun Liu, Jia-Wang Bian, Yu-Chao Gu, Ming-Ming Cheng, IEEE TPAMI, 2021来替换。

docx文件转换成docjava_docx文件转换成docjava_08


🎄纯文字替换

假如上面这篇论文是我们自己的论文(论文可以是Word,这里只是拿PDF举例说明),现在需要将 Res2Net 的模板中文字替换成MobileSal 的文字。首先替换题目和摘要。

docx文件转换成docjava_docx文件转换成docjava_09

只是文字的替换一般不会报错,但是需要注意文字中出现%,docx文件转换成docjava_excel_10


🎄公式与文字混合

比较棘手的是公式和文字混合地方的替换,即使是Word文档,也不能直接将混合地方粘贴进去,因为Word文档中文字可以直接粘贴,但是公式需要转成Latex类型才能放进去。这个时候,上面介绍的公式文字识别神器—mathpix就用到了。拿其中一个段落为例,展示混合文字的替换。选择MobileSal 论文中第4页的公式与文字混合的地方,直接使用mathpix进行截屏识别,识别的结果如下

docx文件转换成docjava_docx文件转换成docjava_11

将识别文字复制到论文对应的文字上,为了展示复制的效果,使用了红色字体标识了复制后的效果。

docx文件转换成docjava_docx文件转换成docjava_12

可以看到,识别的效果很好,直接放到Latex中运行通过。通过以上两个步骤就将论文中文字和公式的部分解决了。


🎄图片的替换

图片的替换跟文字差不多,找到论文中对应图片的代码将自己图放到指定路径,运行即可。这里选择MobileSal 论文中第5页的Figure4进行说明,因为没有原图,我们直接截屏保存 .png 格式,当然也可以放到word中输出PDF进行保存。替换掉Res2Net 中第4页的Fig3。

## 原始的**Res2Net** 中第4页的Fig3
\CheckRmv{
\begin{figure}[t]
  \begin{overpic}[width=\linewidth]{improved_structure.pdf}
  \end{overpic}
  \caption{The \ourM~module can be integrated with
    the dimension cardinality~\cite{xie2017aggregated} (replace conv with group conv)
    and SE~\cite{hu2018senet} blocks.
  }\label{fig:improved_structure}
\end{figure}
}

## 替换**MobileSal** 论文中第5页的Figure4
\CheckRmv{
\begin{figure}[t]
  \begin{overpic}[width=\linewidth]{1.png}
  \end{overpic}
  \caption{\textbf{Qualitative comparison of six challenging datasets.} The
  	results from top to bottom are from NJU2K, DUTLF-D, NLPR, STERE,
  	SSD, and SIP datasets, respectively.
  }\label{fig:Qualitativecomparison}
\end{figure}
}

docx文件转换成docjava_编辑器_13

可以看到完美替换,其他图也可以按照这种方式进行替换。再次提醒,替换一部分就运行一下,如果没有问题再进行后面的替换。


🎄表格的插入

 


🎄文献引用

文献引用方式又多种,本模板使用的是 .bib 的形式,将所有的文献放在一个文件中,打开压缩里面的ref.bib文件,可以看到文献的引用格式,其中pami20Res2net为正文中引用该文献的Key,可以理解为是文献的小名,文中引用的地方使用命令 \cite{pami20Res2net}

@ARTICLE{pami20Res2net, 
  author={Shang-Hua Gao and Ming-Ming Cheng and Kai Zhao and Xin-Yu Zhang and Ming-Hsuan Yang and Philip Torr}, 
  journal=PAMI, 
  title={Res2Net: A New Multi-scale Backbone Architecture}, 
  year={2020}, 
  volume={}, 
  number={}, 
  pages={1-1}, 
  doi={10.1109/TPAMI.2019.2938758}, 
}

docx文件转换成docjava_excel_14

这种文献格式可以通过数据库一键导出,例如当前这篇论文,使用Google学术进行查找,找到之后将bib格式的文献放到ref.bib中运行一下ref.bib文件,记得要运行一下,要不然不会更新,很可能在文中无法引用。


🌿排版的一些提示

✅替换过程中可以暂时不用管排版的美观,将内容都替换之后再统一排版,遵循的原则就是图表要与第一次出现的地方尽可能近,为了论文能读起来很好找到对应的图表。

✅尽可能保证图表在论文中出现的频率一样,不要将表格和图片堆在一页中,适当地方可以在 \begin{figure}[t] 中添加! [!h] 表示就放在当前位置,还有表格中需要强制换行来控制表格的长度,可以使用 \begin{tabular}{{p{1.3cm}p{3.8cm}p{2.5cm}}} 表示表格有三列,每列的宽度强制为1.3,3.8,2.5厘米,该命令对表格强制换行很有用。