yangkang2021.github.io

图像处理算法汇总

一. 基本任务

  1. 整图判断用分类:
    • ResNet
    • SqueezeNet
    • MobileNetV3
    • shufflenet
    • EfficientNets
    • FixEfficientNet-L2
    • NFNets
  2. 矩形框出用检测:
    • fasterRCNN
    • yolov5
    • yolox
    • yolop
    • yolov6
    • yolvv7
  3. 像素级请用分割:
    • unet
    • deeplabv3
    • PaddleSeg
    • detectron2

      二. 小任务

  4. 单目标跟踪:goturn, SiamRPN++
  5. 多目标跟踪:
    • DeepSORT、StrongSORT++, ByteTrack
    • BoT-SORT BoT-SORT

  6. 抠图Matting
    • U^2-Net
    • MODNet
    • skyAR
    • 毛发分割Animal Matting
    • Background Matting V2
    • 图像分割:《End-to-End Referring Video Object Segmentation with Multimodal Transformers》
    • FactorMatte:最新视频抠图算法,更适合于视频合成任务
    • RobustVideoMatting :字节跳动的视频抠图

  7. 超分:
    • BasicVSR++
    • EDVR,RealSR,Topaz
    • 人脸超分:VQFR,FaceFormer
  8. 修复(Inpainting):
    • 修复:Bringing Old Photo Back to Life
    • 腾讯老照片修复
    • 补帧:DAIN
    • 上色:DeOldify/DeepRemaster,DeOldify:最先进的黑白图像上色技术。
  9. OCR:
    • 百度paddleocr
    • easy ocr
    • tesseractOCR
    • MMOCR。
  10. 人脸检测对齐识别
    • seetaface6
    • dlib
    • mtcnn+facenet
    • openface deepid,vggface,arcface
  11. 重识别:
    • cluster-contrast-reid
    • fast-reid
  12. 姿态:
    • openPose
    • posenet
    • MoveNet
  13. 生成对抗网络:
    • styleGanV3
  14. 画像还原真人
    • ArtBreeder/GanBreeder
    • StyleGanV2
  15. 图像降噪与美颜算法
    • Noise2Noise 和 Noise2Void

      三. 大型任务

  16. 换脸
    • DeepFaceLab
    • FaceSwap
    • FaceShifter
    • FaceApp
    • FaceSwap of Realistic-Neural-Talking-Head-Models
    • facePlay
  17. 语音识别参考
    • Kaldi系统:神经网络声学模型+解码图
    • 端到端系统:以CTC或Transducer为主导,国内WeNet,google力推的Cascaded encoder。
  18. 运动模型
    • 一阶运动模型:First-Order-Model
    • 人体动作迁移:impersonator++
    • 声音转唇动Wav2Lip,Lip2Wav。

  19. ai艺术家-diffusion扩散模型:
    • stable diffusion
    • disco diffusion
    • ACGN diffusion(Animation, Comic, Game, Novel)
  20. 艺术创作
    • DeepFaceDrawing
    • Stylized Neural Painting
    • 人物肖像画生成算法 U^2-Net

  21. 单图三维重建
    • 三维估计:FrankMocap/3Dpose_ssl
    • PIFuHD
    • 图像转3维:https://avatarsdk.com/
  22. 三维重建与slam
    • 传统方法:openMVS/openMVG
    • 视觉slam:ORB-SLAM2/ORB-SLAM3
    • 神经辐射场NeRF:NeRF/StyleNeRF/PixelNeRF/IBRNet:今年最火的AI技术!

  23. 对抗生成网络
    • 基础:GAN/DCGAN/CGAN/ACGAN/LSGAN
    • 应用:SRGAN/CycleGAN/pix2pix/styleGan/textToImage
  24. 图像生成应用
    • https://beta.dreamstudio.ai/dream
    • https://openai.com/dall-e-2
    • https://www.artbreeder.com
  25. 其他网站
    • https://zhuanlan.zhihu.com/p/547737982
    • https://mp.weixin.qq.com/mp/homepage?__biz=MzIxODg1OTk1MA==&hid=9&sn=c36dd0e197c0195507a6c6c59c89ab38&scene=1
    • https://weibo.com/p/1005052395607675