作为一种便捷地收集网上信息并从中抽取出可用信息的方式,网络爬虫技术变得越来越有用。使用Python这样的简单编程语言,你可以使用少量编程技能就可以爬取复杂的网站。《用Python写网络爬虫》作为使用Python来爬取网络数据的杰出指南,讲解了从静态页面爬取数据的方法以及使用缓存来管理服务器负载的方法。此外,本书还介绍了如何使用AJAX URL和Firebug扩展来爬取数据,以及有关爬取技术的更多真相,比如使用浏览器渲染、管理cookie、通过提交表单从受验证码保护的复杂网站中抽取数据等。本书使用Scrapy创建了一个高级网络爬虫,并对一些真实的网站进行了爬取。
上传时间: 2022-06-16
上传用户:xsr1983
本文以Turbo码译码器的FPGA实现为目标,对Turbo码的迭代译码算法及用硬件语言实现其译码算法进行了深入研究。 本文首先在理论上对Turbo码的编译码原理进行了深入的研究,并用C语言对其MAP译码算法进行了验证仿真,接着就Turbo码MAP算法的衍生算法即LOG_MAP和MAX_LOG_MAP算法用C程序做了仿真和测试。随后本文就一些对MAP译码性能起着重要影响的参数也用C程序做了仿真对比。 最后,考虑到硬件实现的简化,MAX-Log-MAP算法成为了本文的硬件实现方案。本文采用了模块化设计,在对各个模块进行设计的基础上提出了一些改进的方案,对Turbo码编码器设计中的同步问题进行了改进,对分块并行Turbo码译码算法的硬件实现进行了研究。在设计中综合运用了“自顶向下”和“自下而上”的设计方去,通过功能模块分割,合理设置系统参数,并通过模块之间的参数传递,使Turbo码编译码器具有较好的灵活性。
上传时间: 2013-04-24
上传用户:wengtianzhu
本文以Turbo码编译码器的FPGA实现为目标,对Turbo码的编译码算法和用硬件语言将其实现进行了深入的研究。 首先,在理论上对Turbo码的编译码原理进行了介绍,确定了Max-log-MAF算法的译码算法,结合CCSDS标准,在实现编码器时,针对标准中给定的帧长、码率与交织算法,以及伪随机序列模块与帧同步模块,提出了相应解决方案;而在相应的译码器设计中,采用了FPGA设计中“自上而下”的设计方法,权衡硬件实现复杂度与处理时延等因素,优先考虑面积因素,提高元件的重复利用率和降低电路复杂度,来实现Turbo码的Max-log-MAP算法译码。把整个系统分割成不同的功能模块,分别阐述了实现过程。 然后,基于Verilog HDL 设计出12位固点数据的Turbo编译码器以及仿真验证平台,与用Matlab语言设计的相同指标的浮点数据译码器进行性能比较,得到该设计的功能验证。 最后,研究了Tuxbo码译码器几项最新技术,如滑动窗译码,归一化处理,停止迭代技术结合流水线电路设计,将改进后的译码器与先前设计的译码器分别在ISE开发环境中针对目标器件xilinx Virtex-Ⅱ500进行电路综合,证实了这些改进技术能有效地提高译码器的吞吐量,减少译码时延和存储器面积从而降低功耗。
上传时间: 2013-04-24
上传用户:haohaoxuexi
IIC的EEPROM AT24C系列的操作源码,C语言实现,经典程序,可直接作为模块文件调用,已验证.
上传时间: 2013-12-24
上传用户:问题问题
这是一个用asp.net编写的实用登陆验证源码,利用它可以很好的检测web登陆用户名等。
上传时间: 2015-04-15
上传用户:qiaoyue
VC源码:文件分割器 VC源码:文件分割器
上传时间: 2014-03-11
上传用户:偷心的海盗
mentor UART IP verilog源码 以通过验证.
上传时间: 2014-07-10
上传用户:dyctj
这是MD5验证的CSharp源码。作加密解密的可以看看。
上传时间: 2013-12-02
上传用户:JIUSHICHEN
VC k-means聚类算法源码。kmeans是一种常用的分割算法,简单而又高效
上传时间: 2015-08-24
上传用户:tianyi223
已经验证过的ITU G.729B源码 1.使用定点运算, 纯c实现 2.已经附带了VC6的项目文件(原始的ITU源码只有makefile,没有VC项目文件), 方便初学者入门使用 3.用于测试G.729编码和解码 4.主要应用于VoIP项目
上传时间: 2015-08-25
上传用户:shanml