-
你会用Python做数据预处理吗?
所属栏目:[设计教程] 日期:2019-02-06 热度:92
前戏 在拿到一份数据准备做挖掘建模之前,首先需要进行初步的数据探索性分析(你愿意花十分钟系统了解数据分析方法吗?),对数据探索性分析之后要先进行一系列的数据预处理步骤。因为拿到的原始数据存在不完整、不一致、有异常的数据,而这些错误数据会严重[详细]
-
2019年七大优秀的网页抓取工具
所属栏目:[设计教程] 日期:2019-02-06 热度:117
互联网不断涌现出新的信息,新的设计模式和大量的c。将这些数据组织到一个独特的库中并非易事。不过,有大量优秀的网页抓取工具可供使用。 1.ProxyCrawl 使用Proxy Crawl API,你可以抓取Web上的任何网站/平台。有代理支持,绕过验证码,以及基于动态内容[详细]
-
边缘计算,在网络边缘侧疯狂试探
所属栏目:[设计教程] 日期:2019-02-06 热度:138
哈喽,大家好,今天咱们讨论的主角是边缘计算。 边缘计算(Edge computing ),指在靠近物或数据源头的网络边缘侧,融合网络、计算、存储、应用核心能力的开放平台,就近提供边缘智能服务,满足行业数字化在敏捷连接、实时业务、数据优化、应用智能、安全与[详细]
-
新华三中标青岛地铁 助推青岛城市轨道交通发展
所属栏目:[设计教程] 日期:2019-02-06 热度:184
近日,紫光旗下新华三集团连续中标青岛地铁1号线与8号线的综合监控系统和AFC自动售检票系统,并赢得IT产品的全部份额,助力青岛地铁更好地发挥作为城市交通大动脉的关键职能。 作为青岛市城市轨道交通规划的重要组成,青岛1号线、8号线将分别于2020年、202[详细]
-
分析了一万多条拼车数据,看看北上广深的各位都回哪过年
所属栏目:[设计教程] 日期:2019-02-06 热度:123
目录 前言 统计结果 爬虫思路 统计思路 后记 前言 很早之前发过一篇关于某拼车平台爬虫的文章,因为工作比较忙,一直没有下文。最近年底稍微空了些,加上碰上春节返乡大潮,刚好再拿过来写一下数据分析的思路。 本次数据样本共13041条,本别采集了北京、上[详细]
-
2018年最具影响力的20篇数据科学研究论文,盘它!
所属栏目:[设计教程] 日期:2019-02-06 热度:137
大数据文摘出品 文章来源:opendatascience.com 编译:Ivy、狗小白、云舟 作为一名前半生奉献给学术,现在投身业界的研究者,Daniel Gutierrez习惯在数据科学业内工作的同时,跟进学术界的最新动态。 最近,通过一场网络研讨会,他发现人工智能大神吴恩达([详细]
-
大数据在广电新媒体中的应用
所属栏目:[设计教程] 日期:2019-02-04 热度:135
信息技术的飞速发展,人类已进入了大数据时代。大数据时代催生广播电视媒体的变革,构建新的媒体形态,把受众转化为用户,提升传播力。 大数据在无锡广电的部署和应用 近年来,无锡广电利用大数据技术推进旗下新媒体运营进行了有益探索和实践。智慧无锡是[详细]
-
Python数据可视化:啥是佩奇
所属栏目:[设计教程] 日期:2019-02-04 热度:167
她爹也是猪!她娘也是猪! 儿子还是猪!一窝猪! 或许这就是最好的回答。 原本只是一部电影方与移动合作的宣传短片。 却因里面打动人心的故事,大火了一把。 就如我之前的一篇文章里所提的。 不是年味越来越少,而是我们都长大了。 影片透露出那一股暖人心的亲[详细]
-
思科发布了《IT运营就绪性指数》报告,中国企业IT运营为业务提供更多价值
所属栏目:[设计教程] 日期:2019-02-03 热度:108
【51CTO.com原创稿件】日前,思科发布了《IT运营就绪性指数》报告,思科大中华区资深副总裁兼客户体验事业部总经理徐恺波在与媒体沟通时,对这份报告做了深刻的解读。 记者了解到,这份报告是思科在 2018 年进行的一项大规模研究项目的调研结果,调查范围[详细]
-
2019年将塑造数据中心行业的八大趋势
所属栏目:[设计教程] 日期:2019-02-03 热度:141
如今,2019年已经到来,数据中心市场和技术将在这一年有哪些变化?将有哪些进步和发展?为此,数据中心行业专家对将在2019年塑造数据中心行业发展的8个趋势逐一进行介绍: 1. 超大规模数据中心的交易越来越大 业界用户一直希望通过租赁来获得更多的数据中心[详细]
-
网络监控项目,超过254个点位如何设置IP地址?
所属栏目:[设计教程] 日期:2019-02-03 热度:109
很多朋友都问到,对于大型监控项目如何设置ip地址?对于监控项目来说,很多故障的原因都是跟ip地址设置不当有关,如ip冲突,或者有几路监控图像没有显示等,都是跟ip有一定关联,合理的分配ip地址十分重要。 一、为什么要合理分配IP 对于小型监控项目来说,[详细]
-
四种大数据分析方法与大家分享
所属栏目:[设计教程] 日期:2019-02-01 热度:191
本文主要讲述数据挖掘分析领域中,最常用的四种数据分析方法:描述型分析、诊断型分析、预测型分析和指令型分析。 当刚涉足数据挖掘分析领域的分析师被问及,数据挖掘分析人员最重要的能力是什么时,他们给出了五花八门的答案。 其实我想告诉他们的是,数[详细]
-
你与数据科学家只差这26条Python技巧
所属栏目:[设计教程] 日期:2019-02-01 热度:199
Python是目前世界上最流行的编程语言之一。因为: 它容易学习 它用途超广 它有非常多的开源支持(大量的模块和库) 作者 Peter Gleeson 是一名数据科学家,日常工作几乎离不python。一路走来,他积累了不少有用的技巧和tips,现在就将这些技巧分享给大家。这[详细]
-
三大运营商2018年运营数据,今年干得怎么样?
所属栏目:[设计教程] 日期:2019-02-01 热度:87
2018年已经过去了,这一年,是通信界辛苦劳作的一年。提速降费、混改、建设5G忙的不亦乐乎。有付出就有回报,三大运营商全年的运营数据也已经悉数出炉了,来看看它们的表现如何。 先从移动说起,刚刚过去的2018年,对于中国移动来说无疑是载入史册的一年,[详细]
-
如何判断两个IP地址是否在同一个网段?什么是子网掩码?
所属栏目:[设计教程] 日期:2019-02-01 热度:163
对于ip地址我们前面通过多次文章,大家都有一定的理解,有部分朋友还是对子网掩码、ip地址的网段有些疑问,那么今天我们一起来解下这方面的内容。 一、什么是子网掩码? 在了解ip地址的网段之前,我们先来了解子网掩码,很多对网络了解不深的朋友都对子网掩[详细]
-
这一招,竟能让5G建设节省数千亿元支出!
所属栏目:[设计教程] 日期:2019-02-01 热度:91
近日,欧洲两大运营商沃达丰和西班牙电信旗下的O2宣布将把其网络共享协议扩展至5G网络,这将使其能够以更低的成本加速部署5G移动服务,由此将加大对其竞争对手英国电信(BT)的挑战。在移动通信发展的历史中,蜂窝网络的共建共享在全球主流运营商之间已有不[详细]
-
优雅的读取http请求或响应的数据
所属栏目:[设计教程] 日期:2019-02-01 热度:125
从 http.Request.Body 或 http.Response.Body 中读取数据方法或许很多,标准库中大多数使用 ioutil.ReadAll 方法一次读取所有数据,如果是 json 格式的数据还可以使用 json.NewDecoder 从 io.Reader 创建一个解析器,假使使用 pprof 来分析程序总是会发现[详细]
-
观点分享 | 物联网数据需要共享协议
所属栏目:[设计教程] 日期:2019-02-01 热度:84
物联网设备产生大量数据,即使真正的二级和三级市场机会可能存在于该数据中,但大多数数据也都被专有网络和云孤立,或者在网络边缘就被抛弃了。 人们缺乏的是一种强大且与供应商无关的数据共享协议。从本质上来说,分散和可扩展的对等(P2P)网络为建立这个[详细]
-
谷歌发布自然问答数据集 Natural Questions
所属栏目:[设计教程] 日期:2019-02-01 热度:181
Google 发布用于训练和评估开放领域(Open-domain)问答系统的大型语料库 Natural Questions(NQ)。该数据集包含了 30 万个自然产生的问题和对应的回答注释,每个回答都是人工从维基百科页面找到的答案。另外,Google 还举办了挑战活动,以 NQ 数据集训练的[详细]
-
盘点:2019年值得关注的5大数据中心趋势
所属栏目:[设计教程] 日期:2019-01-31 热度:171
2019年,整个IT行业将延续2018年的发展趋势,更多企业走向数字化、云化,超大规模数据中心逐渐成为主流。在此基础上,许多数据中心都开始面临业务迅速发展带来的巨大压力,这在很大程度上驱动了数据中心建设与运营模式的变革。 为了更好地支持业务运行,企[详细]
-
边缘计算急需解决的难题
所属栏目:[设计教程] 日期:2019-01-31 热度:168
目前边缘计算已经得到了各行各业的广泛重视,并且在很多应用场景下开花结果。根据边缘计算领域特定的特点,本文认为6个方向是未来几年迫切需要解决的问题:编程模型、软硬件选型、基准程序与标准、动态调度、与垂直行业的紧密结合以及边缘节点的落地。 1.[详细]
-
Python爬取4027条脉脉职言,解读互联网人的苦与难!
所属栏目:[设计教程] 日期:2019-01-31 热度:90
脉脉是一个实名职场社交平台。之前爬了脉脉职言版块,大概爬了4027条评论,本文对爬取过程给出详细说明,对于评论内容仅做可视化分析,之前存了一堆这方面的文章,今天一看全都404了。 爬虫 仍然使用python编程,对爬虫没兴趣的可以直接跳过看下部分,不影[详细]
-
大数据技术伦理难题怎么破解
所属栏目:[设计教程] 日期:2019-01-31 热度:122
大数据技术作为一门新兴技术,已经成为人类社会关注的热点,大数据的不断产生、流动和发展,成为具有重要价值的社会资源。大数据技术在给人们工作和生活带来巨大便利的同时,也产生了一系列伦理问题。 大数据技术的伦理问题 随着大数据技术的发展、个人数[详细]
-
谈一谈 IPv6 和 Happy Eyeballs
所属栏目:[设计教程] 日期:2019-01-31 热度:174
先看个图,从 Ipv6 的相关资讯可以看到,各大互联网公司都在推进 Ipv6 的部署和支持,这离不开工信部信通院(信息通信研究院)的大力推进。 Ipv6 的好处就不多说了,如果使用 Ipv6,每个设备都可以分配一个固定的地址,定位起来就方便多了,想想就很美(kong)[详细]
-
布局边缘计算企业需要提前考虑的几个问题
所属栏目:[设计教程] 日期:2019-01-31 热度:156
在物联网应用中,数据处理、分析和存储越来越多地发生在网络边缘侧,接近用户和设备需要访问信息的地方。所以,越来越多的企业将边缘计算当成了重要的发展方向。 市场研究机构Grand View Research最近的一份报告预测,到2025年,全球边缘计算市场的规模将[详细]
