python获取txt文件词向量过程详解-创新互联

在读取https://github.com/Embedding/Chinese-Word-Vectors中的中文词向量时，选择了一个有3G多的txt文件，之前在做词向量时用的是word2vec，所以直接导入模型然后indexword即可。

成都创新互联公司服务项目包括泾川网站建设、泾川网站制作、泾川网页制作以及泾川网络营销策划等。多年来，我们专注于互联网行业，利用自身积累的技术优势、行业经验、深度合作伙伴关系等，向广大中小型企业、政府机构等提供互联网行业的解决方案，泾川网站推广取得了明显的社会效益与经济效益。目前，我们服务的客户以成都为中心已经辐射到泾川省份的部分城市，未来相信会继续扩大服务区域并继续获得客户的支持与信任！

因为这是一个txt大文件，尝试了DataFrame，np.loadtxt等，都没有成功，其中主要遇到的问题是：

如何读取完整的大文件，而不会出现内存不足memery error等问题
将读取出来的文件，保存为npy文件
根据词找到对应的向量

解决办法：

尝试使用的代码：

代码1:
try:
lines=np.loadtxt(filepath)
catch:
感觉这块不会写了咦，，，
  print(ValueError)
但这样的话，它就不会继续循环去读上边的txt了呢

另外有需要云服务器可以了解下创新互联scvps.cn，海内外云服务器15元起步，三天无理由+7*72小时售后在线，公司持有idc许可证，提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案，具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势，专为企业上云打造定制，能够满足用户丰富、多元化的应用场景需求。

文章名称：python获取txt文件词向量过程详解-创新互联
转载源于：http://cdxtjz.cn/article/cessds.html

python获取txt文件词向量过程详解-创新互联

其他资讯