标签:高校
Pew Research Center,于2004年建立,总部设于华盛顿特区,就影响美国及全球的问题、态度与潮流提供信息资料。研究中心受皮尤慈善信托基金资助,资助投放于无倾向性项目之外,也支持倡议性项目。数据集包括美国政治与政策、新闻与媒体 、互联网与科技 、科学与社会 、宗教与公共生活 、西班牙裔...
长短期记忆网络(LSTM,Long Short-Term Memory)是一种时间循环神经网络,是为了解决一般的RNN(循环神经网络)存在的长期依赖问题而专门设计出来的,所有的RNN都具有一种重复神经网络模块的链式形式。在标准RNN中,这个重复的结构模块只有一个非常简单的结构,例如一个tanh层。来...
Delve Datasets,是多伦多大学代尔福实验室提供的数据集。来源网址:http://www.cs.toronto.edu/~delve/data/datasets.html
流数据是指由数千个数据源持续生成的数据,通常也同时以数据记录的形式发送,规模较小(约几千字节)。流数据包括多种数据,例如客户使用您的移动或 Web 应用程序生成的日志文件、网购数据、游戏内玩家活动、社交网站信息、金融交易大厅或地理空间服务,以及来自数据中心内所连接设备或仪器的遥测数据。此类数据需要按...
以柱状图方式展示比特币交易和市场数据,可以输出为 CSV/XLSX 文件。数据包括比特币交易量、成交排行、每分钟交易量、买卖价差和部分区块链数据,包括哈希率、挖矿难度和交易数量。来源网址:https://data.bitcoinity.org/markets
流计算模型,是一种将一般应用转化为以流为基本处理对象的流应用的计算模型,其基本思想是把应用组织成流(stream)和计算核心(kernel)两级。从宏观角度看,流计算模型中被处理的基本数据单位是流,各个操作被视为对整条流的操作。在流计算模型中,对整条流的宏观操作包括流聚合(stream gather...
滑动窗口(Sliding window)是一种流量控制技术。早期的网络通信中,通信双方不会考虑网络的拥挤情况直接发送数据。由于大家不知道网络拥塞状况,同时发送数据,导致中间节点阻塞掉包,谁也发不了数据,所以就有了滑动窗口机制来解决此问题。参见滑动窗口如何根据网络拥塞发送数据仿真视频。滑动窗口协议是用...
巨潮资讯网是中国证券监督管理委员会指定的上市公司信息披露网站,创建于1995年 ,是国内最早的证券信息专业网站,同时亦是国内首家全面披露深沪2500多家上市公司公告信息和市场数据的大型证券专业网站。 2009年9月20日,经中国证监会批准,巨潮资讯网成为创业板指定信息披露网站。来源网址:http:/...
时间戳是使用数字签名技术产生的数据,签名的对象包括了原始文件信息、签名参数、签名时间等信息。时间戳系统用来产生和管理时间戳,对签名对象进行数字签名产生时间戳,以证明原始文件在签名时间之前已经存在。可信时间戳是由联合信任时间戳服务中心签发的一个电子凭证,用于证明电子数据文件自申请可信时间戳后内容保持完...
小波变换(wavelet transform,WT)是一种新的变换分析方法,它继承和发展了短时傅立叶变换局部化的思想,同时又克服了窗口大小不随频率变化等缺点,能够提供一个随频率改变的“时间-频率”窗口,是进行信号时频分析和处理的理想工具。它的主要特点是通过变换能够充分突出问题某些方面的特征,能对时间...
复合事件处理可看作一种处理串流(Streaming)的数据库处理。在关系数据库中所处理的资料是有许多行(Row)的数据表(table),复合事件处理将事件串流当作是数据表来处理,事件类型里的属性相当于数据表的字段。对于政府和企业来讲,处理包含海量信息、图片的庞大数据,已是例行公事。但现在,这一模式正...
China Indicators提供中国经济指数参考。来源网址:https://tradingeconomics.com/china/indicators
文本分析是指对文本的表示及其特征项的选取;文本分析是文本挖掘、信息检索的一个基本问题,它把从文本中抽取出的特征词进行量化来表示文本信息。文本(text),与 讯息(message)的意义大致相同,指的是由一定的符号或符码组成的信息结构体,这种结构体可采用不同的表现形态,如语言的、文字的、影像的等等。...
美国联邦储备银行是美国联邦储备系统所属的私营区域性金融机构。美联储数据统计研究中心提供其研究结果和数据。来源网址:https://www.federalreserve.gov/data.htm
TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常被搜索引擎应用,作为文件与用户查询之间相关程度的度量或评级。除了TF-IDF以外,...
文本分类用电脑对文本集(或其他实体或物件)按照一定的分类体系或标准进行自动分类标记。它根据一个已经被标注的训练文档集合,找到文档特征和文档类别之间的关系模型,然后利用这种学习得到的关系模型对新的文档进行类别判断。文本分类从基于知识的方法逐渐转变为基于统计和机器学习的方法。来源网址:https://b...