-
实时大数据处理Storm(一)
所属栏目:[大数据] 日期:2021-01-25 热度:130
自从Google发表了3篇举世瞩目的论文(Google File System、BigTable和MapReduce)以后,大数据被引爆了。如果说计算机的威力相当于一枚大炮的威力的话,那么互联网的威力相当于一颗原子弹,而大数据的威力则相当于氢弹,大数据成为了IT发展史上的又一次浪潮[详细]
-
ZZNU 1988 (大数取余)
所属栏目:[大数据] 日期:2021-01-25 热度:72
1988: Sn 时间限制: 1 Sec?? 内存限制: 128 MB 提交: 19?? 解决: 8 [提交][状态] 题目描述 给你两个数 n,p(0 n,p = 10^15); a1 = 1;? a2 = 1+2;? a3 = 1+2+3;? ... an = 1+2+3+...+n? Sn = a1+a2+a3+...+an; 求(6*Sn) % p; 输入 ?输入一个数 T表示有T组实例;[详细]
-
HDU 5351 MZL#39;s Border(大数 + 找规律)——2015 Multi-Uni
所属栏目:[大数据] 日期:2021-01-25 热度:73
传送门 MZL’s Border Time Limit: 2000/1000 MS (Java/Others)????Memory Limit: 65536/65536 K (Java/Others) Total Submission(s): 1374????Accepted Submission(s): 452 Problem Description As is known to all,MZL is an extraordinarily lovely girl.[详细]
-
哈佛商评 :使用大数据为消费者创造价值
所属栏目:[大数据] 日期:2021-01-25 热度:90
大数据为市场提供大的保证。显而易见,大数据自推出以来就回答以下两个阻碍市场发展的最烦人的问题: 1)谁买,买什么,什么时候买,什么价位买?2)是否能将消费者所听,所知,所看的东西和他们所购买和所消费的东西联系起来? 通过提高目标市场和鉴别、排[详细]
-
大数据分析平台架构(Big Data Analytics Platform)
所属栏目:[大数据] 日期:2021-01-25 热度:201
一、数据分析平台层次解析 ? 大数据分析处理架构图 数据源: ?除该种方法之外,还可以分为离线数据、近似实时数据和实时数据。按照图中的分类其实就是说明了数据存储的结构,而特别要说的是流数据,它的核心就是数据的连续性和快速分析性; 计算层: ?内存计[详细]
-
开源大数据查询分析引擎现状
所属栏目:[大数据] 日期:2021-01-25 热度:129
文|叶蓬 【按:此文是与我的《基于大数据分析的安全管理平台技术研究及应用》同期发表在内刊上的我的同事们的作品,转载于此。这些基础性的研究和测试对比分析,对于我们的BDSA技术路线选定大有帮助。】 引言 大数据查询分析是云计算中核心问题之一,自从Goo[详细]
-
数据处理,不可不知的常用工具
所属栏目:[大数据] 日期:2021-01-23 热度:137
网页、PDF里的数据获取,令人头大;更别提数据清理了。在大多数情况下,做数据可视化的我们都难以得到最干净整洁全面的“ready to go”的数据,需要我们在网页中去“挖”,再去另外的平台进行“清理”,下面就介绍一些NICAR中被提到的常用工具。 01 网页获取[详细]
-
uva 1639 Candy 大数的对数处理 数学期望
所属栏目:[大数据] 日期:2021-01-23 热度:83
当排列组合数或者幂很大时可以利用对数计算,之后再用exp还原,保证一定的精度。 数学期望是每一个可能的值和相应的概率的乘积和,没有可能值可以设。 仔细读题,吃完最后一个糖果后不知道是否已经吃完,所以需要再选一次。 %f用来输入float,输出float doubl[详细]
-
【BZOJ4542】大数, 莫队
所属栏目:[大数据] 日期:2021-01-23 热度:124
Time:2016.09.10 Author:xiaoyimi 转载注明出处谢谢 传送门 思路: 神奇的东西 断断续续地想了一天没搞出来 因为没想到离散化(╯‵□′)╯︵┻━┻ 有一个有趣的性质 定义 T i = ∑ n j = i s [ i ] ? 10 n ? j + 1 ( m o d P ) s[i]是原字符串中第i个位置的[详细]
-
R语言与金融大数据处理——基础篇(代码)
所属栏目:[大数据] 日期:2021-01-23 热度:189
# 加百力咨询: 《R语言与金融大数据处理》 - 《基础篇》 (v1.0) # 最后修改时间:2014-04-23(17.3) # 加百力咨询: 《R语言与金融大数据处理》 - 《基础篇》 (v1.0) # 主讲人:加百力 ### 01、课程介绍 ### ###### ###### ###### ###### ###### ###### ##[详细]
-
大数据,为什么不是传统BI的简单升级?
所属栏目:[大数据] 日期:2021-01-23 热度:184
本文作者 傅一平,首发于公众号 与数据同行 (ID:ysjtx_fyp),由作者授权 大数据 转载。如需转载请与作者联系,谢绝二次转载。 BI(BusinessIntelligence)即商务智能 ,它是一套完整的解决方案,用来将企业中现有的数据进行有效的整合,快速准确的提供报[详细]
-
?干货|一文读懂Power BI
所属栏目:[大数据] 日期:2021-01-23 热度:139
作者:哥本哈士奇 伴随着数据量的日益增长,通过自服务式的商业智能把数据转换成辅助决策支持的工具,越来越成为迫切的需求。在以前,处理这些数据往往只是IT人员范围内的事,但是通过Power BI for Office 365里面的新功能喝服务,微软降低了这个门槛。它里[详细]
-
访问日志的大数据分析应用
所属栏目:[大数据] 日期:2021-01-23 热度:170
本文整理自APMCon 2016中国应用性能管理大会CDN加速专场又拍云CTO黄慧攀题为《访问日志的大数据分析应用》的演讲,现场解读了在海量访问日志中提炼多个性能指标,对日志分析系统查询需求进行分析,对访问特点进行分析,并基于性能考虑对系统架构进行优化,从[详细]
-
大数据时代:传统BI还能走多远?
所属栏目:[大数据] 日期:2021-01-23 热度:55
div class="iteye-blog-content-contain" style="font-size: 14px;"? 从事BI多年,经历了经营分析系统的大建设,大发展时期,也有幸处在大数据与传统BI系统的交替之际,因此特别来谈谈,传统BI还能走多远? img src="http://p1.pstatp.com/large/e4900012f67[详细]
-
【华为练习题】大数阶乘
所属栏目:[大数据] 日期:2021-01-23 热度:52
【华为练习题】大数阶乘 题目 计算阶乘n!是一件可怕的事情,因为当n并不是很大时,n!将是一个很大的值。例如13! = 6227020800,已经超过了我们常用的unsigned int类型的取值范围。请设计一个程序,使其可以计算100以内的数的阶乘,结果用字符串的形式输出 解[详细]
-
大数取余数-----x的y次方取余数
所属栏目:[大数据] 日期:2021-01-23 热度:121
大数取余数--- 题目描述: 输入一个位数不超过10^6的整数a,求a%5并输出 //此题肯定不能用long,int表示要输入的这个整数,这两种类型表示的范围没有题目要求的那么大;可用string #includeiostream#includestringusing namespace std;int main(){string str[详细]
-
美业B2B龙头博卡:美业大数据价值挖掘才刚刚开始 | 互联网+案例
所属栏目:[大数据] 日期:2021-01-23 热度:107
作为一个立足美业十二年的软件提供商,博卡目前全国市场份额超50%,平台年交易流水约1500亿元。创始人吴新明在谈到当下美业面临的痛点和呼声时认为,由于自身特征,美业彻底革命并非易事,通过帮助经营者进行自我改良或许更合适。 2004年成立的美业软件服务[详细]
-
多数组K大数
所属栏目:[大数据] 日期:2021-01-21 热度:90
题目描述 给定两个有序数组arr1和arr2,在给定一个整数k,返回两个数组的所有数中第K小的数。 例如: arr1 = {1,2,3,4,5}; arr2 = {3,5}; K = 1; 因为1为所有数中最小的,所以返回1; arr1 = {1,3}; arr2 = {3,5,6}; K = 4; 因为3为所有数中第4小的数,所以[详细]
-
ETL是BI(商业智能)的基础,调度是ETL的灵魂
所属栏目:[大数据] 日期:2021-01-21 热度:175
ETL是数据抽取(Extract)、清洗(Cleaning)、转换(Transform)、装载(Load)的过程 你想啊,数据的由来都是ETL实现的,以后所有的数据处理,不都是要依靠这些抽取来的数据。这一块没有做好,后面的分析,展现就是来了大神,他也没有办法,就像巧妇难为无[详细]
-
大数定律理解
所属栏目:[大数据] 日期:2021-01-20 热度:70
概率论中的大数定律都发端于伯努利的工作。下面我们来回顾下这个问题: 假设袋中有 a 个白球, b 个黑球, p = a a + b 。有放回的从袋中抽球 N 次,记录抽到白球的次数为 X ,我们用 X N 去估计 p 。伯努利视图证明的就是:用 X N 去估计 p 的确定性——他[详细]
-
13招神技,让你在数据科学和数据分析工作中脱颖而出
所属栏目:[大数据] 日期:2021-01-20 热度:126
本文首发于 ?36大数据 ?(微信ID:dashuju36),大数据 经授权转载。如需转载,请与首发公众号联系授权事宜。 原文标题:13 Tips to make you awesome in Data Science / Analytics Jobs 作者:Tavish Srivastava 译者:36大数据翻译组-望天翻译 原文网址:h[详细]
-
大数运算之阶乘
所属栏目:[大数据] 日期:2021-01-20 热度:172
Int不能存储较大数 int 代表有符号整数,也就是说,用 int 声明的变量可以是正数,可以是负数,也可以是零,但是只能是整数。标准规定 int 的最小取值范围是 -32767 到 32767。 int 的取值范围因机器而异,但是一定要大于或者等于 -32767 到 32767。一般来说[详细]
-
BigData学习3_大数据技术Hadoop面试题_选择和判断
所属栏目:[大数据] 日期:2021-01-20 热度:181
单项选择题 1. 下面哪个程序负责 HDFS 数据存储。 a)NameNode b)Jobtracker c)Datanode d)secondaryNameNode e)tasktracker 2. HDfS 中的 block 默认保存几份? a)3 份 b)2 份 c)1 份 d)不确定 3. 下列哪个程序通常与 NameNode 在一个节点启动? a)Secondary[详细]
-
使用超大规模数据分析技术支持大数据预测
所属栏目:[大数据] 日期:2021-01-20 热度:114
今天我给大家带来的演讲内容是关于“使用超大规模数据分析技术支持大数据预测”这方面的。首先介绍一下我自己,我叫韩卿,很多人叫我Luke。我是Kyligence公司的联合创始人兼CEO,Apache Kylin开源项目的创始人,同时也是这个项目的项目管理委员会主席,以及A[详细]
-
利用文本挖掘技术来找出网络中的“小鲜词”
所属栏目:[大数据] 日期:2021-01-20 热度:142
开始之前,先看一下从人人网中发现的90后用户爱用的词 是不是很好玩,哈哈。写这篇文章就是让你简单的自动的从文本中找出新的词,这样就知道现在的年轻人喜欢什么了(对于博主这种上了年纪的人来说,真的是很有用,呜呜) 项目结构 当然,text.dat和common.d[详细]
