上面是一段实时目标识别的演示, 计算机在视频流上标注出物体的类别, 包括人、汽车、自行车、狗、背包、领带、椅子等。今天的计算机视觉技术已经可以在图片、视频中识别出大量类别的物体, 甚至可以初步理解图片或者视频中的内容, 在这方面,人工智能已经达到了3 岁儿童的智力水平。这是一个很了不起的成就, 毕竟人工智能用了几十年的时间, 就走完了人类几十万年的进化之路,并且还在加速发展。道路总是曲折的, 也是有迹可循的。在尝试了其它方法之后, 计算机视觉在仿生学里找到了正确的道路(至少目前看是正确的) 。通过研究人类的视觉原理,计算机利用深度神经网络( Deep Neural Network,NN)实现了对图片的识别,包括文字识别、物体分类、图像理解等。在这个过程中,神经元和神经网络模型、大数据技术的发展,以及处理器(尤其是GPU)强大的算力,给人工智能技术的发展提供了很大的支持。本文是一篇学习笔记, 以深度优先的思路, 记录了对深度学习(Deep Learning)的简单梳理,主要针对计算机视觉应用领域。
上传时间: 2022-06-22
上传用户:
OpenCV的全称是:Open Source Computer Vision Library。OpenCV是一个基于(开源)发行的跨平台计算机视觉库,可以运行在Linux、Windows和Mac OS操作系统上。
上传时间: 2013-05-22
上传用户:eeworm
MIX的模拟器: MIX是《计算机程序设计艺术》(TAOCP)的作者高德纳(Donald.E.Knuth)在TAOCP中描述算法时使用的一种假想的机器,所以书中的汇编代码无法在任何一个机器上运行,附件中的程序可以让以MIXAL汇编语言写成的算法在Windows平台上汇编并且可以单步跟踪运行。详细情况参看其中的MIXBuilder.doc文件。
上传时间: 2015-04-03
上传用户:wkchong
计算机算法设计与分析_苏德富等 格式:pdg
上传时间: 2015-04-17
上传用户:zsjzc
浙江大学 博士学位论文 论文题目 视频流中的人体运动提取与运动合成 作者姓名 罗 忠 祥 指导教师 潘 云 鹤 院士 庄 越 挺 教授 学科(专业) 计算机科学与技术 所在学院 计算机科学与技术学院
上传时间: 2015-08-06
上传用户:王小奇
机器视觉技术是计算机科学的重要研究领域,其中背景图像中字符的提取和识别有重大的研究意义.通过分析复杂背景中字符存在的特点,针对快速分割和识别的应用需求,提出了一种在色调上将阀值法和区域生长法相结合的分割方法.
上传时间: 2016-01-31
上传用户:ma1301115706
用VC++编的云台控制系统,一台主机可以控制多个云台,用户通过计算机串口发出相应的控制指令,解码器解析指令,达到控制目的
上传时间: 2013-12-25
上传用户:lgnf
用VB6.0编的云台控制程序,一台主机可以通过一个解码器控制多个云台,用户通过计算机串口发出相应的控制指令,达到控制目的.
上传时间: 2016-03-21
上传用户:aig85
基于最大熵的隐马尔可夫模型文本信息抽取,林亚平!刘云中!周顺先!陈治平!蔡立军"湖南大学计算机与通信学院!湖南长沙#$%%&
上传时间: 2016-05-06
上传用户:风之骄子
青少年计算机竞赛指导丛书 青少年国际和全国信息学(计算机)奥林匹克竞赛指导——图论的算法与程序设计 吴文虎 王建德
上传时间: 2013-12-19
上传用户:sclyutian