您可以捐助,支持我们的公益事业。

1元 10元 50元





认证码:  验证码,看不清楚?请点击刷新验证码 必填



  求知 文章 文库 Lib 视频 iPerson 课程 认证 咨询 工具 讲座 Model Center   Code  
会员   
   
 
     
   
 订阅
  捐助
一文了解 caffe 框架
 
 
   次浏览      
 2021-3-30 
 
编辑推荐:
本文主要介绍了什么是caffe、caffe的特点及caffe的框架,希望对你有帮助。
本文来自于CSDN,由火龙果软件Linda编辑、推荐。

1 什么是caffe

Caffe 全称:Convolution Architecture For Feature Extraction(用于特征抽取的卷积框架)。

Caffe是一个清晰、可读性高、快速的深度学习框架。

Caffe前身是decaf,由加州伯克利大学博士贾扬青开发的一个用于深度卷积网络的Python框架(无GPU)模式,之后被伯克利大学实验室团队丰富成caffe。

2 Caffe的特点

Expression:通过文本来构建模型和优化策略,而不是代码。

Speed:现有的CNN模型中速度最快。在NVIDIA K40 或Titan GPU*上,训练一张图片要5ms,测试一张图片要2ms。

Modularity:易扩展

纯C++/CUDA构建的框架,提供了命令行、Python、MATLAB接口

实现了CPU和GPU的无缝结合

Caffe Model Zoo :model share

3 CNN框架:LeNet

1998年LeCun 提出的用于手写字体的卷积神经网络。

4 CNN框架:AlexNet

AlexNet :2012年Hinton教授和其他学生Alex Krizhevsky, llya Sutskever提出的用于图像识别的CNN框架。

5 数据层(data_layer)

caffe 通过数据层获取数据。数据的来源可以是多种形式。例如:

LevelDB,LMDB(两种键值对嵌入式数据库管理系统编程库,一般LMDB比LevelDB存取速度快,所以caffe默认的事LMDB)

直接从内存读取

HDF5文件

原始图片

类 data_layer.hpp/data_layer.cpp

在定义网络的prototxt 文件中可以定义数据层的形式,比如手写字体数据层定义如下:

数据传递(blob)

caffe框架中数据是以blob的形式进行传递

blob是一个标准的数组,主要负责caffe中数据的存储(store),关联(communicate)。数据在网络结构中要经过正向和反向的传播的过程,在这个过程中要对数据进行存储、数据之间进行通信、以及数据的操作。blob就是负责这个过程。

在具体的形式上blob是回一个4-D结构的array,是按照(Num, Channels. Height, Width)的顺序存储的。

Nums:表示一次训练输入的图片数量

Channels:表示通道数

Height:表示图片高度

Width:表示图片的宽度

实际上blob 是存储的数据在内存中的索引,比如index(n,k,h,w)定位在((n*k + k)*H + h)*W+w。示意图如下:

6 卷积层(convolution)

卷积层定义了图像的卷积操作(即特征抽象),参数设置在prototxt中 ,它相关的类定义在conv_layer.cpp。

例如用到的一个卷积:

7 受限线性单元(RELU)

RELU的全称:rectified linear units。

受限线性单元实际上就是激活函数max(0,x), 它的相关类定义在relu_layer.cpp中。

相比之下,ReLU的速度非常快,而且精准度更高。因此ReLU逐渐取代sigmoid成为主流

8 池化层(POOLING)

池化层定义了对对象的降维操作。它的相关类定义在pooling_layer.cpp。参数设置prototxt中。

 

9 局部响应归一化层(LRN)

LRN全称是Local Response Normalization,相关的类定义在lrn_layer.cpp中,其参数定义在prototxt中。局部响应归一化层完成一种“临近抑制”操作,对局部输入区域进行归一化。本质上是防止激活函数饱和,能提升网络的泛化能力,将错误率降低。

local_size:两种表示

通道间归一化时表示求和的通道数

通道内归一化时表示求和区间的边长;默认值为5

alpha:缩放因子,默认值为1

beta:指数项,默认值为1

NormRegion:选择对相邻通道间归一化or通道内空间区域归一化,默认为ACROSS_CHANNELS。

在通道间归一化模式中,局部区域范围在相邻通道间,但没有空间扩展(即尺寸为local_size11);在通道内归一化模式中,局部区域在空间上扩展,但只针对独立通道进行(即尺寸为1local_sizelocal_size);每个输入值都将除以

 

10 全连接层(INNER_PRODUCT)

全连接层相关的类定义在inner_product_layer.cpp中,输出特征都是1*1的特征,参数定义在prototxt中。

 

11 Dropout层

Dropout层的相关类定义在dropout.cpp中,它的作用是防止过拟合和降低计算复杂度。

在实际训练中,每个节点都以相互独立的以p概率出现,实验证明p=0.5时在大规模网络中效果最优

12 输出(分类)层(softmax)

相关类定义在softmax_lay,cpp中:

   
次浏览       
相关文章

基于图卷积网络的图深度学习
自动驾驶中的3D目标检测
工业机器人控制系统架构介绍
项目实战:如何构建知识图谱
 
相关文档

5G人工智能物联网的典型应用
深度学习在自动驾驶中的应用
图神经网络在交叉学科领域的应用研究
无人机系统原理
相关课程

人工智能、机器学习&TensorFlow
机器人软件开发技术
人工智能,机器学习和深度学习
图像处理算法方法与实践
最新活动计划
LLM大模型应用与项目构建 12-26[特惠]
QT应用开发 11-21[线上]
C++高级编程 11-27[北京]
业务建模&领域驱动设计 11-15[北京]
用户研究与用户建模 11-21[北京]
SysML和EA进行系统设计建模 11-28[北京]
 
最新文章
多目标跟踪:AI产品经理需要了解的CV通识
深度学习架构
卷积神经网络之前向传播算法
从0到1搭建AI中台
工业机器人控制系统架构介绍
最新课程
人工智能,机器学习和深度学习
人工智能与机器学习应用实战
人工智能-图像处理和识别
人工智能、机器学习& TensorFlow+Keras框架实践
人工智能+Python+大数据
更多...   
成功案例
某综合性科研机构 人工智能与机器学习应用
某银行 人工智能+Python+大数据
北京 人工智能、机器学习& TensorFlow框架实践
某领先数字地图提供商 Python数据分析与机器学习
中国移动 人工智能、机器学习和深度学习
更多...