今天,我们将使用深度学习来创建面部解锁算法。 要完成我们的任务需要三个主要部分。
1. 查找人脸的算法
1. 一种将人脸嵌入向量空间的方法
1. 比较已编码人脸的函数
人脸面孔查找和定位
首先,我们需要一种在图像中查找人脸的方法。 我们可以使用一种称为MTCNN(多任务级联卷积网络)的端到端方法。
只是一点技术背景,所以称为Cascaded,因为它由多个阶段组成,每个阶段都有其神经网络。 下图显示了该框架。
2024年09月22日
今天,我们将使用深度学习来创建面部解锁算法。 要完成我们的任务需要三个主要部分。
1. 查找人脸的算法
1. 一种将人脸嵌入向量空间的方法
1. 比较已编码人脸的函数
首先,我们需要一种在图像中查找人脸的方法。 我们可以使用一种称为MTCNN(多任务级联卷积网络)的端到端方法。
只是一点技术背景,所以称为Cascaded,因为它由多个阶段组成,每个阶段都有其神经网络。 下图显示了该框架。
2024年09月22日
2024年09月22日
不可否认,我们正处于语言人工智能的革命时代。开发人员正在意识到语言理解和生成模型的大量新兴功能。新一代应用程序的关键构建之一是支持搜索系统的嵌入。为了帮助开发人员快速开始使用常用的数据集,人工智能初创公司Cohere发布了Embedding Archives数据集,可以免费下载用来供AI研究者和企业用于训练和加强自己的AI模型。
Cohere还发布了Multilingual embedding模型,模型中他们嵌入了多语言的数百万Wiki百科的内容数据。其内容已经被分割成段落,并为每个段落计算一个嵌入向量。
2024年09月22日
近几年,Attention-based 方法因其可解释和有效性,受到了学术界和工业界的欢迎。但是,由于论文中提出的网络结构通常被嵌入到分类、检测、分割等代码框架中,导致代码比较冗余,对于像我这样的小白很难找到网络的核心代码,导致在论文和网络思想的理解上会有一定困难。因此,我把最近看的 Attention、MLP 和 Re-parameter 论文的核心代码进行了整理和复现,方便各位读者理解。本文主要对该项目的 Attention 部分做简要介绍。
2024年09月22日
欢迎来到本次PyTorch实战应用开发教程!在这个教程中,我们将创建一个基于卷积神经网络(CNN)的图像风格迁移应用,允许用户将一张图像的风格应用到另一张图像上。
2024年09月22日
近日,商汤和港中文联合开源了 mmdetection,这是一个基于 PyTorch 的开源目标检测工具包,属于香港中文大学多媒体实验室 open-mmlab 项目的一部分。该工具包支持 Mask RCNN 等多种流行的检测框架,读者可在 PyTorch 环境下测试不同的预训练模型及训练新的检测分割模型。
项目地址:https://github.com/open-mmlab/mmdetection
2024年09月22日
Attention的核心思想是:从关注全部到关注重点。
Attention 机制很像人类看图片的逻辑,当我们看一张图片的时候,我们并没有看清图片的全部内容,而是将注意力集中在了图片的焦点上。大家看下面这张图自行体会:
对于CV中早期的Attention,通常是在通道或者空间计算注意力分布,例如:SENet,CBAM。
2024年09月22日
图神经网络(gnn)是一类功能强大的神经网络,它对图结构数据进行操作。它们通过从节点的局部邻域聚合信息来学习节点表示(嵌入)。这个概念在图表示学习文献中被称为“消息传递”。
消息(嵌入)通过多个GNN层在图中的节点之间传递。每个节点聚合来自其邻居的消息以更新其表示。这个过程跨层重复,允许节点获得编码有关图的更丰富信息的表示。gnn的一主要变体有GraphSAGE[2]、Graph Convolution Network[3]等。
图注意力网络(GAT)[1]是一类特殊的gnn,主要的改进是消息传递的方式。他们引入了一种可学习的注意力机制,通过在每个源节点和目标节点之间分配权重,使节点能够在聚合来自本地邻居的消息时决定哪个邻居节点更重要,而不是以相同的权重聚合来自所有邻居的信息。
2024年09月22日
1、固定随机种子
torch.manual_seed(0) torch.cuda.manual_seed_all(0)
2、指定程序运行在特定 GPU 卡上
2024年09月22日
本篇笔记以介绍 pytorch 中的 autograd 模块功能为主,主要涉及 torch/autograd 下代码,不涉及底层的 C++ 实现。本文涉及的源码以 PyTorch 1.7 为准。