/LLM 多模态视觉大模型/
1.大模型技术概述
| 1. 视觉大模型技术概述.mp4 21.88M
2.自监督学习的原理与方法
| 2.1自监督学习与前置任务.mp4 17.74M
| 2.2对比学习与SimCLR.mp4 18.62M
| 2.3Moco模型.mp4 11.71M
| 2.4MoCo代码详解.mp4 23.52M
| 2.5掩码重建与BEiT.mp4 10.54M
3.视觉基础大模型的架构
| 3.1 ViT与其变种.mp4 15.14M
| 3.2 MoCo v3自监督骨干网络.mp4 7.81M
| 3.3 DINO模型.mp4 12.63M
| 3.4 DINO代码详解.mp4 17.19M
| 3.5 MAE模型.mp4 9.64M
| 3.6 MAE代码详解.mp4 26.33M
| 3.7 SAM模型.mp4 23.55M
4.多模态视觉大模型
| 4.1 多模态学习的概念.mp4 28.11M
| 4.2 多模态网络的架构.mp4 23.62M
| 4.3 CLIP模型.mp4 19.34M
| 4.4 CLIP代码详解.mp4 28.17M
| 4.5 GLIP模型.mp4 11.26M
| 4.6 Flamingo模型.mp4 27.58M
| 4.7 LLaVA模型.mp4 44.59M
5.下游任务迁移与视觉提示
| 5.1 线性探测与微调.mp4 8.80M
| 5.2 线性探测与微调代码详解.mp4 12.66M
| 5.3 Adapter方法.mp4 13.31M
| 5.4 Adapter代码详解.mp4 55.46M
| 5.5 视觉prompt方法.mp4 58.06M
| 5.6 视觉Prompt代码详解.mp4 36.99M
| 5.7 小结.mp4 3.56M
6.实战-多模态大模型微调
| 6.1 PandaGPT框架介绍.mp4 44.93M
| 6.2 环境与模型配置.mp4 108.10M
| 6.3 项目代码通览.mp4 109.86M
| 6.4 数据集加载.mp4 94.70M
| 6.5 模型定义.mp4 144.59M
| 6.6 模型实现.mp4 234.10M
| 6.7 Demo运行.mp4 62.57M
| code .zip 27.63M
| Vicuna模型加载指南.txt 0.37kb
| 端口映射方法.txt 0.08kb
7.实战-基于视觉提示的下游迁移
| 7.1 VPT框架通览.mp4 127.32M
| 7.2 数据集加载.mp4 109.92M
| 7.3 模型定义.mp4 155.92M
| 7.4 模型实现1.mp4 94.20M
| 7.5 模型实现2.mp4 76.86M
| 7.6 病理图像下游迁移.mp4 43.75M
| BCI数据集下载.txt 0.87kb
| code .zip 1021.61kb
code
| adapter.py 3.84kb
| CLIP.py 3.27kb
| DINO.py 3.13kb
| linear-probing.py 1.69kb
| MAE.py 4.34kb
| moco.py 2.23kb
| prompt-tuning.py 3.26kb
| 全部代码压缩包.zip 9.74kb
PPT
| 0.视觉大模型课程前置介绍.pptx 1.90M
| 1.大模型技术概述.pptx 5.31M
| 2.自监督学习的原理与方法.pptx 3.04M
| 3.视觉基础大模型的架构.pptx 3.02M
| 4.多模态视觉大模型.pptx 4.79M
| 5.下游任务迁移与视觉提示.pptx 1.59M
论文
| Gemini-A Family of Highly Capable Multimodal Models.pdf 25.69M
| ImageBind-One Embedding Space To Bind Them All.pdf 6.34M
| InternVL-Scaling up Vision Foundation Models and Aligning for Generic Visual-Linguistic Tasks.pdf 1.25M
PPT.zip 19.13M
评论0