HivisionIDPhoto 旨在开发一种实用、系统性的证件照智能制作算法。
它利用一套完善的AI模型工作流程,实现对多种用户拍照场景的识别、抠图与证件照生成。
项目地址: https://github.com/Zeyi-Lin/HivisionIDPhotos
一键整合包:https://pan.quark.cn/s/d6f35777f125
注:exe自解压后双击开始运行.bat;不要放到中文目录下!
HivisionIDPhoto 可以做到:
-
轻量级抠图(纯离线,仅需 CPU 即可快速推理)
-
根据不同尺寸规格生成不同的标准证件照、六寸排版照
-
支持 纯离线 或 端云 推理
-
美颜
-
智能换正装(waiting)
功能简介:
模型均存到项目的
hivision/creator/weights
目录下:人像抠图模型 | 介绍 | 下载 |
MODNet | MODNet官方权重 | 下载(24.7MB) |
hivision_modnet | 对纯色换底适配性更好的抠图模型 | 下载(24.7MB) |
rmbg-1.4 | BRIA AI 开源的抠图模型 | 下载(176.2MB)后重命名为rmbg-1.4.onnx |
birefnet-v1-lite | ZhengPeng7 开源的抠图模型,拥有最好的分割精度 | 下载(224MB)后重命名为birefnet-v1-lite.onnx |
人脸检测模型配置(可选)
拓展人脸检测模型 | 介绍 | 使用文档 |
MTCNN | 离线人脸检测模型,高性能CPU推理(毫秒级),为默认模型,检测精度较低 | Clone此项目后直接使用 |
RetinaFace | 离线人脸检测模型,CPU推理速度中等(秒级),精度较高 | 下载后放到hivision/creator/retinaface/weights目录下 |
Face++ | 旷视推出的在线人脸检测API,检测精度较高,官方文档 | 使用文档 |
性能参考
测试环境为Mac M1 Max 64GB,非GPU加速,测试图片分辨率为 512×715(1) 与 764×1146(2)。
模型组合 | 内存占用 | 推理时长(1) | 推理时长(2) |
MODNet + mtcnn | 410MB | 0.207s | 0.246s |
MODNet + retinaface | 405MB | 0.571s | 0.971s |
birefnet-v1-lite + retinaface | 6.20GB | 7.063s | 7.128s |
FAQ
-
如何修改预设尺寸和颜色?
-
尺寸:修改size_list_CN.csv后再次运行
app.py
即可,其中第一列为尺寸名,第二列为高度,第三列为宽度。 -
颜色:修改color_list_CN.csv后再次运行
app.py
即可,其中第一列为颜色名,第二列为Hex值。
-
如何修改水印字体?
-
将字体文件放到
hivision/plugin/font
文件夹下 -
修改
hivision/plugin/watermark.py
的font_file
参数值为字体文件名
-
-
如何添加社交媒体模板照?
-
将模板图片放到
hivision/plugin/template/assets
文件夹下。模板图片是一个4通道的透明png。 -
在
hivision/plugin/template/assets/template_config.json
文件中添加最新的模板信息,其中width
为模板图宽度(px),height
为模板图高度(px),anchor_points
为模板中透明区域的四个角的坐标(px);rotation
为透明区域相对于垂直方向的旋转角度,>0为逆时针,<0为顺时针。 -
在
demo/processor.py
的_generate_image_template
函数中的TEMPLATE_NAME_LIST
变量添加最新的模板名
-
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
暂无评论内容