HuggingFace在NLP和計算機視覺中的應用 - Reddit

banq發表於2022-04-20

你想做語義分割嗎?檢視https://huggingface.co/blog/fine-tune-segformer
影像分類?https://huggingface.co/blog/fine-tune-vit

您可以檢視https://github.com/huggingface/transformers/tree/main/examples/pytorch以查詢用於語義分割、影像分類、影像預訓練等的示例指令碼!

您可以使用 ``datasets`` 輕鬆推送或下載影像資料集,例如在https://huggingface.co/blog/image-search-datasets中。
ConvNeXT ( https://huggingface.co/docs/transformers/model_doc/convnext ), ResNET ( https://huggingface.co/docs/transformers/main/en/model_doc/resnet ), Vision Transformer ( https://huggingface .co/docs/transformers/model_doc/vit),ImageGPT(https://huggingface.co/docs/transformers/main/en/model_doc/imagegpt),PoolFormer(https://huggingface.co/docs/transformers/main /en/model_doc/poolformer)和許多其他模型架構,包括多模態模型,例如 Perceiver ( https://huggingface.co/docs/transformers/main/en/model_doc/perceiver )。
甚至可以使用互動式演示直接在瀏覽器中玩模型


Hugging Face 為許多模型和資料集提供計算機視覺支援!ViT、DeiT、DETR 等模型以及文件解析模型也可用。在 HF 模型集線器上,也有很多專注於視覺的任務(所有任務請參見左側選擇器):https ://huggingface.co/models

更詳細地說,目前支援以下任務:

所有模型都可以在https://huggingface.co/docs/transformers/index找到。
更多教程可以在https://github.com/NielsRogge/Transformers-Tutorials找到。

https://github.com/rwightman/pytorch-image-models

相關文章