関連プロジェクト:
- SwanLab:人物切り抜きモデルの訓練を通じて、分析と監視、ラボの仲間との協力と交流を行い、訓練効率を大幅に向上させました。
-
2024.09.11: Gradioデモに透過画像表示とダウンロード機能を追加しました。
-
2024.09.09: 新しい背景除去モデル BiRefNet-v1-lite を追加 | Gradioに高度なパラメータ設定およびウォーターマークタブを追加
-
2024.09.08: 新しい切り抜きモデル RMBG-1.4 を追加 | ComfyUIワークフロー - HivisionIDPhotos-ComfyUI AIFSHによる貢献
-
2024.09.07: 顔検出APIオプション Face++ を追加し、より高精度な顔検出を実現
-
2024.09.06: 新しい切り抜きモデル modnet_photographic_portrait_matting.onnx を追加
-
2024.09.05: Restful API ドキュメント を更新
-
2024.09.02: 写真のKBサイズを調整を更新、DockerHub
-
2023.12.01: **APIデプロイ(fastapiベース)**を更新
🚀 私たちの仕事に興味を持っていただきありがとうございます。画像分野における他の成果もぜひご覧ください。お問い合わせは、zeyi.lin@swanhub.co まで。
HivisionIDPhotoは、実用的で体系的な証明写真のスマート制作アルゴリズムを開発することを目的としています。
さまざまなユーザー撮影シーンの認識、切り抜きおよび証明写真の生成を実現するために、一連の洗練されたAIモデル作業フローを利用しています。
HivisionIDPhotoは以下のことができます:
- 軽量切り抜き(完全オフラインで、CPUのみで迅速に推論可能)
- 異なるサイズ仕様に基づいて異なる標準証明写真、六寸レイアウト写真を生成
- 完全オフラインまたはエッジクラウド推論をサポート
- 美顔(待機中)
- スマートな正装変更(待機中)
HivisionIDPhotoがあなたに役立つ場合は、このリポジトリをスターしたり、友人に推薦したりして、証明写真の緊急制作の問題を解決してください!
私たちは、コミュニティによって構築されたHivisionIDPhotosの興味深いアプリケーションや拡張機能をいくつか共有しています:
- HivisionIDPhotos-windows-GUI:Windowsクライアントアプリケーション、zhaoyun0071によって構築されました
- HivisionIDPhotos-ComfyUI:ComfyUI証明写真処理ワークフロー、AIFSHによって構築されました
環境のインストールと依存関係:
- Python >= 3.7(プロジェクトは主にpython 3.10でテストされています)
- OS: Linux, Windows, MacOS
git clone https://github.com/Zeyi-Lin/HivisionIDPhotos.git
cd HivisionIDPhotos
condaでpython3.10の仮想環境を作成することをお勧めします。その後、以下のコマンドを実行してください。
pip install -r requirements.txt
pip install -r requirements-app.txt
方法一:スクリプトでダウンロード
python scripts/download_model.py --models all
方法二:直接ダウンロード
プロジェクトのhivision/creator/weights
ディレクトリに保存します:
modnet_photographic_portrait_matting.onnx
(24.7MB): MODNet公式の重み、ダウンロードhivision_modnet.onnx
(24.7MB): 単色背景に対して適応性の高い切り抜きモデル、ダウンロードrmbg-1.4.onnx
(176.2MB): BRIA AIのオープンソース切り抜きモデル、ダウンロード後にrmbg-1.4.onnx
にリネームbirefnet-v1-lite.onnx
(224MB): ZhengPeng7のオープンソース切り抜きモデル、ダウンロード後にbirefnet-v1-lite.onnx
にリネーム
拡張顔検出モデル | 説明 | 使用文書 |
---|---|---|
MTCNN | オフライン顔検出モデル、高性能CPU推論、デフォルトモデル、検出精度は低い | このプロジェクトをクローン後、直接使用 |
Face++ | Megviiが提供するオンライン顔検出API、高精度の検出、公式文書 | 使用文書 |
NVIDIA GPUによる推論加速を使用する場合は、CUDAとcuDNNがインストールされていることを確認し、文書に従って対応するonnxruntime-gpu
バージョンをインストールします。例:
# CUDA 12.x, cuDNN 8
pip install onnxruntime-gpu==1.18.0
完了後、birefnet-v1-lite
モデルを呼び出すと、GPUによる推論加速が利用されます。
python app.py
プログラムを実行すると、ローカルWebページが生成され、ページ内で証明写真の操作と対話が可能になります。
コアパラメータ:
-i
: 入力画像パス-o
: 保存画像パス-t
: 推論タイプ、idphoto、human_matting、add_background、generate_layout_photosから選択可能--matting_model
: 人物切り抜きモデル重みの選択--face_detect_model
: 顔検出モデルの選択
詳しいパラメータは、python inference.py --help
で確認できます。
1枚の写真を入力し、1枚の標準証明写真と1枚の高解像度証明写真の4チャンネル透明PNGを得る。
python inference.py -i demo/images/test.jpg -o ./idphoto.png --height 413 --width 295
python inference.py -t human_matting -i demo/images/test.jpg -o ./idphoto_matting.png --matting_model hivision_modnet
1枚の4チャンネル透明PNGを入力し、背景色を追加した画像を得る。
python inference.py -t add_background -i ./idphoto.png -o ./idphoto_ab.jpg -c 4f83ce -k 30 -r 1
1枚の3チャンネル写真を入力し、1枚の六寸レイアウト写真を得る。
python inference.py -t generate_layout_photos -i ./idphoto_ab.jpg -o ./idphoto_layout.jpg --height 413 --width 295 -k 200
python deploy_api.py
詳細なリクエスト方法はAPIドキュメントを参照してください。以下のリクエスト例が含まれます:
以下の方法から3つを選択してください。
方法一:最新のイメージをプル:
docker pull linzeyi/hivision_idphotos
方法二:Dockerfileから直接イメージをビルド:
モデル重みファイルhivision_modnet.onnxをhivision/creator/weights
に配置したことを確認した後、プロジェクトのルートディレクトリで実行:
docker build -t linzeyi/hivision_idphotos .
方法三:Docker composeでビルド:
モデル重みファイルhivision_modnet.onnxをhivision/creator/weights
に配置したことを確認した後、プロジェクトのルートディレクトリで実行:
docker compose build
Gradioデモサービスを起動
次のコマンドを実行し、ローカルで http://127.0.0.1:7860 にアクセスすると使用可能です。
docker run -d -p 7860:7860 linzeyi/hivision_idphotos
APIバックエンドサービスを起動
docker run -d -p 8080:8080 linzeyi/hivision_idphotos python3 deploy_api.py
2つのサービスを同時に起動
docker compose up -d
本プロジェクトは、いくつかの追加設定項目を提供し、環境変数を使用して設定します:
環境変数 | タイプ | 説明 | 例 |
---|---|---|---|
FACE_PLUS_API_KEY | オプション | これはFace++コンソールで申請したAPIキーです。 | 7-fZStDJ···· |
FACE_PLUS_API_SECRET | オプション | Face++ APIキーに対応するSecret | VTee824E···· |
dockerでの環境変数使用例:
docker run -d -p 7860:7860 \
-e FACE_PLUS_API_KEY=7-fZStDJ···· \
-e FACE_PLUS_API_SECRET=VTee824E···· \
linzeyi/hivision_idphotos
- MTCNN:
@software{ipazc_mtcnn_2021,
author = {ipazc},
title = {{MTCNN}},
url = {https://github.com/ipazc/mtcnn},
year = {2021},
publisher = {GitHub}
}
- ModNet:
@software{zhkkke_modnet_2021,
author = {ZHKKKe},
title = {{ModNet}},
url = {https://github.com/ZHKKKe/MODNet},
year = {2021},
publisher = {GitHub}
}
- サイズ:
size_list_EN.csv
を修正した後、再度app.py
を実行すれば、第一列がサイズ名、第二列が高さ、第三列が幅になります。 - 色:
color_list_EN.csv
を修正した後、再度app.py
を実行すれば、第一列が色名、第二列がHex値になります。
- フォントファイルを
hivision/plugin/font
フォルダーに配置します。 hivision/plugin/watermark.py
のfont_file
パラメータの値をフォントファイルの名前に変更します。
ご不明な点がございましたら、zeyi.lin@swanhub.coまでメールをお送りください。
Zeyi-Lin、SAKURA-CAT、Feudalman、swpfY、Kaikaikaifang、ShaohonChen、KashiwaByte