-
业务数据可视化的6个卓越实践
所属栏目:[大数据] 日期:2021-06-02 热度:166
通过数据可视化,业务分析人员可以更容易地检测给定数据集中的市场趋势、模式和异常值。专家表示,考虑到人类大脑处理信息的方式,使用图表等图形元素来可视化复[详细]
-
影响数据科学未来的主要走向
所属栏目:[大数据] 日期:2021-06-02 热度:139
数据科学可以帮助企业使用先进工具和技术实现与提[详细]
-
什么样的数据架构适合我们?
所属栏目:[大数据] 日期:2021-06-02 热度:199
与信息体系结构,系统体系结构和软件体系结构相比,数据体系结构相对较新。 数据架构师的角色也是模糊的,已经落在了高级业务分析师,ETL开发人员和数据科学家的[详细]
-
8个用于数据挖掘的卓越开源工具
所属栏目:[大数据] 日期:2021-06-02 热度:109
在机器学习的流程中数据挖掘是重要的一环。数据挖掘是从大量数据中提取隐藏的或未知,但可能有用信息的过程。这些数据最终会被加上标签,用于模型的训练。很多的[详细]
-
大数据时代如何“任人唯贤”智能设备与用户隐私
所属栏目:[大数据] 日期:2021-06-02 热度:60
1.务实是数据收集的关键。 德勤2019年发布的中国智能制造分析报告指出,大部分企业正致力于数据纵向集成,其中81%的受访企业已完成计算机化阶段,而63%的企业已[详细]
-
跨越实验室: IBM为企业推进人工智能注入新动力
所属栏目:[大数据] 日期:2021-06-02 热度:192
2020年7月9日,2020年世界人工智能大会(the World Artificial Intelligence Conference, WAIC)云端峰会正式开幕,IBM的人工智能辩论系统IBM Project Debater荣[详细]
-
用于数据分析的8个SQL招式
所属栏目:[大数据] 日期:2021-06-02 热度:195
结构化查询语言(SQL)已经存在了几十年。它是一种编程语言,用于管理关系数据库中保存的数据。 世界各地的大多数大公司都在使用SQL。数据分析员可以使用SQL访问、[详细]
-
监控大规模Hadoop集群,Prometheus大获全胜Zabbix?
所属栏目:[大数据] 日期:2021-06-02 热度:184
随着公司业务发展,大数据集群规模正在不断扩大,一些大型集群物理机节点甚至已近上千。面对如此规模庞大的集群,一套优秀的监控系统是运维人员发现及处理故障的[详细]
-
苹果AirPods、AirPods Max 和 AirPods Pro 将不支持无损音乐
所属栏目:[大数据] 日期:2021-06-01 热度:135
苹果的无损音频被编码为苹果无损音频编解码文件,无损质量从16位44.1kHz 到24位48kHz,Hi-Res Lossless 提供24位192kHz 质量。 苹果公司向外媒 T3证实,AirPods[详细]
-
联邦学习首个国际标准正式推出!
所属栏目:[大数据] 日期:2021-06-01 热度:169
2018年年底,国内学术界与产业界在隐私计算领域开始了一场基于联邦学习技术的生态建设持久战。 那年12月,IEEE标准委员会(SASB)批准了由微众银行发起的关于《[详细]
-
Twitter新方案:审视自家算法里的“无心之失”
所属栏目:[大数据] 日期:2021-06-01 热度:87
首要任务之一是评估Twitter图像裁剪算法中的种族和性别偏见。随着越来越多的新闻网站和社交媒体采用AI识别、提取图片,人们开始注意到许多算法,尤其是面部识别[详细]
-
人工智能进行时—王者荣耀推动产学研 共享AI新生态
所属栏目:[大数据] 日期:2021-06-01 热度:165
在王者荣耀中做前沿AI研究 多智能体系统(大量的能够自主决策的AI共同协作,达成同一个目标)作为前沿人工智能技术的核心研究领域,经过多年的研究,已经广泛应[详细]
-
对话南科大沈平:在人工智能开源中,高校能充当什么角色?
所属栏目:[大数据] 日期:2021-06-01 热度:109
2020年被称为深度学习框架开源的元年。 那一年,继百度飞桨之后,旷视开源天元(MegEngine),华为推出MindSpore,清华大学计算机系的图形学实验室也发布了自主[详细]
-
一个“帮助大家”的IOI金牌得主
所属栏目:[大数据] 日期:2021-06-01 热度:193
福州青年陈磊也不例外。 1996年,当时正在福建师大附中就读高二的陈磊凭借出色的编程能力,与四川成都七中的王小川、南京金陵中学的李申杰与东北育才学校的王益[详细]
-
概述数据挖掘的基本概念及其最惯用算法
所属栏目:[大数据] 日期:2021-06-01 热度:111
当前,大数据的理论和应用正在国民经济和生活的各个领域如火如荼的进行。很多人对大数据的基本概念和特点已经有所了解,那么我们仅仅将大数据进行获[详细]
-
Pandas常用技能概括
所属栏目:[大数据] 日期:2021-06-01 热度:105
归纳整理了一些工作中常用到的pandas使用技巧,方便更高效地实现数据分析。 1.计算变量缺失率 df=pd.read_csv( titanic_train.csv ) defmissing_cal(df): df:数[详细]
-
百度搜索大数据:地摊经济爆炸!
所属栏目:[大数据] 日期:2021-06-01 热度:178
为应对新冠疫情冲击下的就业危机,我国多个城市放宽了对地摊经济的管制。李克强总理提出:地摊经济、小店经济是就业岗位的重要来源,是人间的烟火,和高大上一样[详细]
-
随着AIoT的来临,人类的生活将发生怎样的变化?
所属栏目:[大数据] 日期:2021-06-01 热度:192
AIoT可以对不同的经济部门产生巨大的影响。它可以帮助癌症的早期诊断,改善天气预报,并使制造智能化。AIoT也将改变人们的生活方式;智能房屋、智能温控器、智能[详细]
-
N个数,求第K大数
所属栏目:[大数据] 日期:2021-05-31 热度:51
今天同学给我出了一道题是这样的: 有n个 不重复 的数,这n个数可以放入内存中,让你用最快的方法找到第k大的数。 解答: 一般情况我们可能考虑,先将n个数排序(快排序、堆排序),然后可以得到结果。但是当n很大时这样做的效率会很低。所以我们提出一种更[详细]
-
51Nod-1005-大数加法
所属栏目:[大数据] 日期:2021-05-31 热度:105
今天遇见一道细节问题特别多的题,写得我眼疼,题本身不难,难得是他的细节问题繁多,需要考虑的情况也甚多,稍有不慎就侧漏了,哈哈。题的思路也很清晰,就是将最后的结果的正负的符号分离出来,剩下的就是高精度的加减法了,利用字符串处理即可,效率可以[详细]
-
【983】大数据实操:社交数据在征信领域的分析应用
所属栏目:[大数据] 日期:2021-05-31 热度:54
本文主要内容由社交征信背景、社交网络数据分析、个体用户画像研究、社交圈子研究、模型建设及应用这五部分构成,下面文章将逐一介绍。 一、社交征信背景 征信不是一个简单的由征信进行评分的模型,而是由数据公司、征信公司、征信使用方三部分组成。数据公[详细]
-
如何存一个大数
所属栏目:[大数据] 日期:2021-05-31 热度:165
题目: ? ? 输入数字n,按顺序打印出1到最大的n位十进制数。比如输入3,则打印出1,2,3,一直到最大的3位数即999。 ? ?此题看起来简单,当我刚开始看到问题后,首先想到的就是先求出最大值,然后在一个一个打印出就ok啦。但是仔细理解题意,并没有告诉n的取值[详细]
-
基因数据处理18之基因序列生成工具wgsim安装和使用
所属栏目:[大数据] 日期:2021-05-31 热度:123
1.下载: https://github.com/lh3/wgsim 可以git或者zip 2.安装: gcc -g -O2 -Wall -o wgsim wgsim.c -lz -lm 3.数据下载:可以使用bwakit下载: https://github.com/lh3/bwa/tree/master/bwakit 下载: bwa.kit/run-gen-ref hs38DH 4.使用方法和默认配置:[详细]
-
BI 商业智能/数据仓库实施杂谈
所属栏目:[大数据] 日期:2021-05-31 热度:194
从最初接触BI商业智能到现在已经十多年的时间,一直以乙方角色工作。今天忽然想就BI在甲方公司的应用情况做些总结,以及提一些设想,也希望有兴趣的朋友一起交流。与具体工具无关,偏重于方法论的讨论。 早期的BI实施情形大概类似于这样,大家都没太经历过BI[详细]
-
基因数据处理19之BWA匹配算法串产生、匹配、评价等整体流程
所属栏目:[大数据] 日期:2021-05-31 热度:182
环境: ubunut BWA samtools wgsim bwa.kit工具 1 .数据下载:需要在bwa.kit下 bwa.kit/run-gen-ref hs38DH 2.串产生: hadoop@Mcnode1:~/cloud/adam/xubo/data/hs38DH$ wgsim -N 1000 -1 10 hs38DH.fa span style="font-family: Arial,Helvetica,sans-serif[详细]
