斯坦福120类狗分类


斯坦福犬数据集含120种犬的20580张图像,用于细粒度分类。文中介绍了解压数据集、安装PaddleX与PaddleClas等环境准备步骤,还涉及用PaddleX划分数据集、配置PaddleClas进行训练,以及模型评估、预测和推理等流程,总结了相关工具在图像分类任务中的表现及注意事项。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

斯坦福120类狗分类 -

你是什么样的狗?

斯坦福120类狗分类 -        

什么?你不认识?那么来让AI告诉你吧!

斯坦福120类狗分类 -        

1.数据集介绍

1.1语境

斯坦福犬数据集包含来自世界各地的120种犬的图像。此数据集是使用ImageNet的图像和注释构建的,用于完成细粒度的图像分类任务。它最初是为进行细粒度图像分类而收集的,这是一个具有挑战性的问题,因为某些犬种具有几乎相同的特征或颜色和年龄不同。

1.2内容

  • 类别数:120
  • 图片数量:20,580
  • 其他:标签,标注框

1.3 致谢

原始数据源可在 http://vision.stanford.edu/aditya86/ImageNetDogs/ 上找到,其中包含有关训练/测试拆分和基线结果的其他信息。

如果您在出版物中使用此数据集,请在以下论文中引用该数据集:

first

Aditya Khosla,Nityananda Jayadevaprakash,Bangpeng Yao和Li Fei-Fei。用于细粒度图像分类的新型数据集。第一次细粒度视觉分类(FGVC)研讨会,IEEE计算机视觉和模式识别会议(CVPR),2011年。[pdf] [海报] [BibTex]

Secondary

J. Deng,W. Dong,R. Socher,L.-J。Li,K. Li和L. Fei-Fei,ImageNet:大型分层图像数据库。IEEE计算机视觉和模式识别(CVPR),2009年。[pdf] [BibTex]

https://unsplash.com/photos/U6nlG0Y5sfs

1.3 其他任务

  • 您能否正确识别具有类似特征的犬种,例如贝塞猎狗和猎犬?
  • 这吉娃娃是年纪大还是年纪大?

2.数据解压

In [ ]
# 解压缩,一次即可# !unzip -aoq data/data87695/Stanford_Dogs_Dataset.zip -d dataset
    In [ ]
!ls dataset/images/Images/
   

由上可见共计有120分类

简小派 简小派

简小派是一款AI原生求职工具,通过简历优化、岗位匹配、项目生成、模拟面试与智能投递,全链路提升求职成功率,帮助普通人更快拿到更好的 offer。

简小派 123 查看详情 简小派

3.环境准备

3.1 paddlex安装

In [ ]
# PaddleX安装! pip install paddlex# 切记切记paddle2onnx!pip install paddle2onnx
   

3.2 paddleclas安装

In [ ]
!git clone https://gitee.com/paddlepaddle/PaddleClas.git --depth=1
    In [ ]
!cd PaddleClas && pip3 install --upgrade -r requirements.txt
   

4.数据集处理

4.1利用paddlex划分数据集

分别生成 labels.txt test_list.txt train_list.txt val_list.txt

In [ ]
# 数据集划分!paddlex --split_dataset --format ImageNet --dataset_dir ~/dataset/images/Images --val_value 0.2 --test_value 0.1
   

4.2标签查看

In [ ]
# 各种标签查看!cat  ~/dataset/images/Images/labels.txt
   

5.PaddleClas配置

5.1 基础配置

  • 进入PaddleClas目录
  • 设置显卡
In [ ]
# 进入PaddleClas%cd ~/PaddleClas
    In [ ]
!export CUDA_VISIBLE_DEVICES=0
   

5.2 PaddleClas训练配置

使用PaddleClas/configs/MobileNetV3/MobileNetV3smallx075.yaml

mode: 'train'ARCHITECTURE:
    name: "MobileNetV3_small_x0_75"pretrained_model: ""model_s*e_dir: "./output/"# 120类classes_num: 120# 总图片数量total_images: 20580s*e_interval: 1ls_epsilon: 0.1validate: Truevalid_interval: 1# 训练轮次epochs: 360topk: 5image_shape: [3, 224, 224]LEARNING_RATE:
    function: 'Cosine'
    params:
        lr: 2.6
        warmup_epoch: 5OPTIMIZER:
    function: 'Momentum'
    params:
        momentum: 0.9
    regularizer:
        function: 'L2'
        factor: 0.00002TRAIN:
    batch_size: 4096
    num_workers: 4
    file_list: "/home/aistudio/dataset/images/Images/train_list.txt"
    data_dir: "/home/aistudio/dataset/images/Images"
    shuffle_seed: 0
    transforms:
        - DecodeImage:
            to_rgb: True
            channel_first: False
        - RandCropImage:
            size: 224
        - RandFlipImage:
            flip_code: 1
        - NormalizeImage:
            scale: 1./255.
            mean: [0.485, 0.456, 0.406]            std: [0.229, 0.224, 0.225]            order: ''
        - ToCHWImage:VALID:
    batch_size: 64
    num_workers: 4
    file_list: "/home/aistudio/dataset/images/Images/val_list.txt"
    data_dir: "/home/aistudio/dataset/images/Images"
    shuffle_seed: 0
    transforms:
        - DecodeImage:
            to_rgb: True
            channel_first: False
        - ResizeImage:
            resize_short: 256
        - CropImage:
            size: 224
        - NormalizeImage:
            scale: 1.0/255.0
            mean: [0.485, 0.456, 0.406]            std: [0.229, 0.224, 0.225]            order: ''
        - ToCHWImage:
    In [ ]
!pwd
   

5.3训练bug

2025-05-10 01:36:33,765 - ERROR - DataLoader reader thread raised an exception!2025-05-10 01:36:33,766 - ERROR - (Fatal) Blocking queue is killed because the data reader raises an exception.
  [Hint: Expected killed_ != true, but received killed_:1 == true:1.] (at /paddle/paddle/fluid/operators/reader/blocking_queue.h:158)
   

5.4 finetune

'./configs/quick_start/MobileNetV3_large_x1_0_finetune.yaml'

mode: 'train'ARCHITECTURE:
    name: 'MobileNetV3_large_x1_0'pretrained_model: "./pretrained/MobileNetV3_large_x1_0_pretrained"model_s*e_dir: "./output/"use_gpu: True# 120类classes_num: 120# 总图片数量20580total_images: 14499s*e_interval: 1validate: Truevalid_interval: 1epochs: 20topk: 1image_shape: [3, 224, 224]LEARNING_RATE:
    function: 'Cosine'          
    params:                   
        lr: 0.00375OPTIMIZER:
    function: 'Momentum'
    params:
        momentum: 0.9
    regularizer:
        function: 'L2'
        factor: 0.000001TRAIN:
    batch_size: 160
    num_workers: 0
    file_list: "/home/aistudio/dataset/images/Images/train_list.txt"
    data_dir: "/home/aistudio/dataset/images/Images/"
    shuffle_seed: 0
    transforms:
        - DecodeImage:
            to_rgb: True
            channel_first: False
        - RandCropImage:
            size: 224
        - RandFlipImage:
            flip_code: 1
        - NormalizeImage:
            scale: 1./255.
            mean: [0.485, 0.456, 0.406]            std: [0.229, 0.224, 0.225]            order: ''
        - ToCHWImage:VALID:
    batch_size: 160
    num_workers: 0
    file_list: "/home/aistudio/dataset/images/Images/val_list.txt"
    data_dir: "/home/aistudio/dataset/images/Images/"
    shuffle_seed: 0
    transforms:
        - DecodeImage:
            to_rgb: True
            channel_first: False
        - ResizeImage:
            resize_short: 256
        - CropImage:
            size: 224
        - NormalizeImage:
            scale: 1.0/255.0
            mean: [0.485, 0.456, 0.406]            std: [0.229, 0.224, 0.225]            order: ''
        - ToCHWImage:
   

5.5下载预训练模型

In [ ]
 !python tools/download.py -a MobileNetV3_large_x1_0 -p ./pretrained -d True
   

6.开始训练

In [21]
!python tools/train.py -c './configs/quick_start/MobileNetV3_large_x1_0_finetune.yaml'
   

visualDL可视化metrics图标

斯坦福120类狗分类 -        

7. 模型评估

可以通过以下命令进行模型评估。

In [23]
!python tools/eval.py \
    -c ./configs/quick_start/MobileNetV3_large_x1_0_finetune.yaml \
    -o pretrained_model="./output/MobileNetV3_large_x1_0/best_model/ppcls"\
    -o load_static_weights=False
   

8. 使用预训练模型进行模型预测

模型训练完成之后,可以加载训练得到的预训练模型,进行模型预测。在模型库的 tools/infer/infer.py 中提供了完整的示例,只需执行下述命令即可完成模型预测:

In [25]
!python tools/infer/infer.py \
    -i ../111.jpg \
    --model MobileNetV3_large_x1_0 \
    --pretrained_model "./output/MobileNetV3_large_x1_0/best_model/ppcls" \
    --use_gpu True \
    --load_static_weights False
   

9.使用inference模型进行模型推理

通过导出inference模型,PaddlePaddle支持使用预测引擎进行预测推理。接下来介绍如何用预测引擎进行推理: 首先,对训练好的模型进行转换:

In [27]
!python tools/export_model.py \
    --model MobileNetV3_large_x1_0 \
    --pretrained_model ./output/MobileNetV3_large_x1_0/best_model/ppcls \
    --output_path ./inference
    In [29]
!python tools/infer/predict.py \
    --image_file ../dataset/images/Images/n02085936-Maltese_dog/n02085936_10148.jpg \
    --model_file "./inference/inference.pdmodel" \
    --params_file "./inference/inference.pdiparams" \
    --use_gpu=True \
    --use_tensorrt=False
   

10.总结

总的来说,paddleclas以及paddlex面对多类型、大数据量图像分类任务有很优秀得表现,有以下几点需要注意:

  1. 在提高acc并兼顾效率时,最好使用轻量级模型,并适当选择图像增强策略;
  2. 使用visualDL可视化Metrics,可以实时观察训练走势,即使调整策略。

以上就是斯坦福120类狗分类的详细内容,更多请关注其它相关文章!


# 官网  # 巫山县网站推广公司  # 银川seo网络营销服务  # 凉山景区网站建设价格  # app存在有seo吗  # 赣州网站建设 公司  # 商业网站建设网站运营  # 泉州视频矩阵营销推广怎么做  # 兰州关键词推广价格排名  # 荷塘区微信营销推广平台  # 有名气的网站优化霸屏  # 请在  # 你不  # 只需  # 世界各地  # 你是  # python  # 细粒度  # 一言  # 中文网  # 斯坦福  # fig  # splash  # udio  # operator  # igs  # red  # cos  # ai  # 工具  # git 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 优化推广96088 】 【 技术知识133117 】 【 IDC资讯59369 】 【 网络运营7196 】 【 IT资讯61894


相关推荐: 数据显示:人工智能相关专业热度上升最快 考古、美术、生物医学工程等小众专业火了  OpenAI 为开发者推出 GPT 聊天机器人 API 大更新,同时降低价格  软通动力天枢元宇宙研究院签约落户江宁高新区  生成式AI爆发,亚马逊云科技持续专注创新,助力企业数字化转型  华为云盘古大模型3.0发布 AI云服务同时上线:200亿亿次性能  微软Xbox称VR和AR还需要时间 先玩大的  华为即将推出HarmonyOS 4,再度领先行业的AI技术  美图秀秀“AI 扩图”功能上线,可根据图像生成更大画幅  谷歌StyleDrop在可控性上卷翻MidJourney,前GitHub CTO用AI颠覆编程  羚客系统即将升级,推出全新的AI数字化工具  利用AI探索抗体“钥匙”、加速药物研发——访百图生科团队  Bing Chat 和 Bing Search 正式引入深色模式  华为大模型登Nature正刊!审稿人:让人们重新审视预报模型的未来  AI技术改变*,新骗局来袭,*成功率接近100%  讯飞听见会写“会议摘要”功能全面升级,AI更懂你的关注点  "探索Meta发布的Quest MR/VR视频录制与拍摄指南"  静安大宁功能区企业云天励飞亮相2025世界人工智能大会,秀出AI硬实力!  人工智能在交通领域的革新:智能解决方案彻底改变交通方式  B站内测 AI 搜索功能,输入“?”即可体验  海南科技职业大学第25届中国机器人及人工智能大赛海南赛区荣获一等奖等114项  严打“黑飞”,无人机检测反制设备护航大运会净空安全  AI人工智能软件,婚纱设计师的必备利器  商汤科技:元萝卜 AI 下棋机器人新品发布会 6 月 14 日举行  机器人 展才能  原小米 9 号员工李明打造全球首款 AI 安卓桌面机器人  网易数帆以AI融合创新引领数据分析与软件开发新趋势  面向AI大模型,腾讯云首次完整披露自研星脉高性能计算网络  AI与5G的强强联合:唤醒数字时代的无尽潜能  即时 AI再次升级 30秒生成自带动效的网页 生成速度提升100%  GPT-4 模型架构泄露:包含 1.8 万亿参数、采用混合专家模型  生活垃圾智能分类机器人社区展“才能”,征求居民意见  阿里达摩院向公众免费开放100项AI专利许可  用人工智能技术,亚马逊为用户生成产品评论摘要,帮助他们轻松选购  吴恩达、Hinton最新对话!AI不是随机鹦鹉,共识胜过一切,LeCun双手赞成  支持跨语言、人声狗吠互换,仅利用最近邻的简单语音转换模型有多神奇  探索AI前沿理念 2025全球人工智能技术大会在杭州开幕  AI 冥想应用 Ogimi.ai 推出,可为用户提供教练级个性化指导  Xreal AR 眼镜用投屏盒子 Beam 发布:分体式设计,到手 699 元  优地网络助力新媒体拥抱人工智能时代  “直击”AI新世界,智能机器人再次“火出圈”了  物联网“僵尸网络DDos攻击”增长惊人,威胁全球电信网络  重塑未来生活的五项技术趋势  当TS遇上AI,会发生什么?  AI赋能艺术 超现实达利奇幻之旅在沪开启  朱民:普通人炒股炒不过机器人是很正常的 AI已经能理解市场情绪  微软最新推出的NaturalSpeech2语音合成模型:提供更准确的语音重构,避免棒读效果  CREATOR制造、使用工具,实现LLM「自我进化」  长宁这家企业在世界人工智能大会上荣获“蓝鼎奖”  东软成立魔形科技研究院,积极布局大语言模型系统工程战略,迎接AI时代  陈根:AI冥想教练为用户提供个性化指导 

 2025-07-25

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

运城市盐湖区信雨科技有限公司


运城市盐湖区信雨科技有限公司

运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商,作为谷歌推广与Facebook广告全球合作伙伴,聚焦外贸企业出海痛点,以数字化营销为核心,提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持,打破传统外贸获客壁垒,助力企业高效开拓全球市场,成为中小企业出海的可靠合作伙伴。

 8156699

 13765294890

 8156699@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.