longriyao

Results 12 comments of longriyao

茅台股份2020年 年报 [https://www.moutaichina.com/maotaigf/resource/cms/article/408431/509361/2021033108591131837.pdf](url) 年报格式很标准,麻烦大佬看下! [这里有茅台其他年份的报告](https://www.moutaichina.com/maotaigf/tzzgx/cwbg/f10ab3ed-1.html)

[这里有其他公司的年报 格式都差不多](http://www.cninfo.com.cn/new/commonUrl/pageOfSearch?url=disclosure/list/search&checkedCategory=category_ndbg_szsh#szseMain/important)

简单实现的话 我觉得是不是可以 1. 一级目录按照现有方法识别 2. 确定是不是二三级目录,通过判断 是否粗体?是否只有一行?开始位置是否包含 特殊字符( 1-9,大写数字 小括号等字符)

我觉得这些简单的策略基本就满足大部分年报了 就可以了

不能判断粗体确实挺伤的,如果能判断粗体就很容易了

输入是彩色图,dataLayer层会把彩色图片灰度化, 将彩色图片和灰度图一起输入,所以label是2倍,分别是彩色图的和灰度图的label

没有对应的paper 网络结构大致拷贝的https://github.com/aleju/colorizer