郭文贵讲话中提到的人和组织

上图是以郭文贵讲话的文字稿为基础,用BERT模型做NER(name entity recognition)得到的提及次数最多的人和组织。

仅对结果进行了微不足道的调整。

因为文字稿未校对,NER模型也未训练很久,结果一般般,比如班农都没出现。

权当是练手吧。

感谢:

https://yiqiedoushiganggangkaishi.org

https://github.com/BrikerMan/Kashgari

https://github.com/amueller/word_cloud