当前位置：服务支持 > 软件文章 > GitHub优秀项目分享：基于YOLOv3的轻量级人脸检测、增值税发票OCR识别等8大项目

GitHub优秀项目分享：基于YOLOv3的轻量级人脸检测、增值税发票OCR识别等8大项目

阅读数 491

点击上方“机器学习与生成对抗网络”，关注"星标" 获取有趣、好玩的前沿干货！

文章来源：七月在线实验室

yolo-face-with-landmark 使用pytroch实现的基于yolov3的轻量级人脸检测

实现的功能：

添加关键点检测分支，使用wing loss。

安装和使用：

git clone https://github.com/ouyanghuiyu/yolo-face-with-landmark 使用src/retinaface2yololandmark.py脚本将retinaface的标记文件转为yolo的格式使用使用src/create_train.py 创建训练样本

测试：

在wider face val精度（单尺度输入分辨率：320*240）

在wider face val精度（单尺度输入分辨率：640*480）

项目地址：

https://github.com/ouyanghuiyu/yolo-face-with-landmark

metfaces-dataset 从艺术品中提取的人脸图像数据集

MetFaces是从艺术品中提取的人脸图像数据集，最初是我们在以下方面的工作之一：

用有限的数据训练生成对抗网络

该数据集包含1336个分辨率为1024×1024的高质量PNG图像。这些图像是通过大都会艺术博物馆收藏的API下载的，并使用dlib自动对齐和裁剪。各种自动过滤器用于修剪设备。

所有数据都托管在Google云端硬盘上：

项目地址：

https://github.com/NVlabs/metfaces-dataset

invoice 增值税发票OCR识别

增值税发票OCR识别，使用flask微服务架构，识别type：增值税电子普通发票，增值税普通发票，增值税专用发票；识别字段为：发票代码、发票号码、开票日期、校验码、税后金额等。

环境：

python3.5/3.6 依赖项安装： pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

模型架构：

Y0L0v3+CRNN+CTC

模型:

模型下载地址：

https://pan.baidu.com/s/1bjtd3ueiUj3rt16p2_YQ2w

将下载完毕的模型文件夹models放置于项目根目录下。

服务启动:

python3 app.py

服务调用地址：

http://...: [端口号]/invoice-ocr，例：http://127.0.0.1:11111/invoice-ocr

项目地址：

https://github.com/guanshuicheng/invoice

OpenSelfSup 自监督学习工具箱和基准

以下是无监督学习，自监督学习和表象学习之间的关系。此项目专注于阴影区域，即无监督的表示学习。自监督的表示学习是它的主要分支。

由于在很多情况下，我们不会严格区分自监督表示学习和无监督表示学习，因此我们仍将此项目称为OpenSelfSup。

主要特征：

所有方法都在一个存储库中灵活性和可扩展性 OpenSelfSup遵循MMDetection的类似代码体系结构，但比MMDetection更加灵活，因为OpenSelfSup集成了各种自我监督的任务，包括分类，联合聚类和特征学习，对比学习，带有存储库的任务等。效率所有方法都支持多机多GPU分布式训练。标准化基准对基准进行了标准化，包括逻辑回归，线性探测特征的SVM /低速SVM，半监督分类和对象检测。

项目地址：

https://github.com/open-mmlab/OpenSelfSup

detectron2 对象检测和分割平台

Detectron2是Facebook AI Research的下一代软件系统，可实现最新的对象检测算法。它是对先前版本Detectron的完全重写，它源自maskrcnn-benchmark。

特性：

由PyTorch深度学习框架提供支持。包括更多功能，例如全景分割，密集姿势，Cascade R-CNN，旋转边界框等。可用作库来支持基于它的不同项目。我们将以这种方式开源更多的研究项目。训练得更快。

通常会根据对ImageNet分类任务进行预训练的骨干模型进行初始化。提供以下主干模型：

R-50.pkl：MSRA原始ResNet-50模型的转换副本。 R-101.pkl：MSRA原始ResNet-101模型的转换副本。 X-101-32x8d.pkl：在FB用Caffe2训练的ResNeXt-101-32x8d模型。 R-50.pkl（torchvision）：Torchvision的ResNet-50模型的转换副本。

项目地址：

https://github.com/facebookresearch/detectron2

person-reid-3d 3D空间中的人员重新识别