扫一扫
关注微信公众号
大数据
企业该如何以及何时聘用数据科学家
  十年前,分析师会将分析审核过的数据分享给使用数据的工作人员。现在,企业依靠数据运行,每天都有自动化流程、机器学习模型和成百上千
02-02
2024 年数据工程:对数据湖和服务层的预测
(MeSSrro Shutterstock)数据湖预测从 Hadoop 继续前进: 2023 年,DuckDB (C++)、Polars (Rust) 和 Apache Arrow (Go、Ru
01-31
科技运营数据管理实践
  01引言  随着十四五规划提出发展数字经济,推动数字产业化和产业数字化转型,各商业银行正处于数字化转型的深水区,在加速金融科技数
11-01
如何充分利用数据可视化
如果一张图片抵得上一千字文字,那么想象一下,可视化工具可以对数据做什么呢?阅读本文,了解如何充分发挥这项强大技术的潜力吧。要点:数
10-26
数据驱动业务,就得这么干!
问题场景:某零售公司,同时有线下门店和线上自营微商城,现在大老板要求运营部门提升同时在两个平台下单用户比例。运营总监表示:数据驱动
10-26
面向小型企业的八个大数据解决方案
大数据是对许多传统数据处理方法来说过于复杂、庞大或快速的信息。大数据可以帮助企业解决关键问题,加强网络安全,并规划有意义的数据和分
10-16
数据分析,如何驱动科学决策
数据分析要支持管理层做出科学的,准确的决策——这是很多企业对数据分析师的要求。然而问题来了:到底咋个支持法?!为啥辛辛苦苦码了一大
10-10
可以帮助企业避免遭受勒索软件攻击的三个策略
在过去的十年里,黑客索要的赎金的平均价值从数百美元上升到数十万美元——在某些情况下甚至达到数百万美元。随着监管要求日益严格,CISO因
09-06
大数据及其影响:企业如何充分利用它
作为一个流行词,大数据已经存在很长一段时间了。每天生成的数据量呈指数级增长,企业是时候采用新的框架来理解这些信息了。持续的数字化转
09-06
数据管理如何实现可持续发展?
  今年早些时候,新加坡首任政府首席可持续发展官宣布,政府将在2023财政年度结束前发布第一份可持续发展报告。  到2024年,所有法定委
09-01
人类创造的数据太贵了!开发者悄悄使用AI合成数据训练模型
  企业正在收集拍字节、艾字节甚至泽字节数量级的数据。  但数据是混乱的,往往是分散和孤立的。许多企业对于在某些环境中使用数据犹豫
08-02
AI重塑软件行业 TiDB Serverless重塑数据库
以 创新涌动于先为主题的PingCAP用户峰会2023于7月13日在京成功举办。会上,PingCAP全面解析了AI时代TiDB的演进方向,宣布更低成本的TiDB
07-31
数据集静态水平分类
在设计应用程序时,一个常见的挑战是根据数据变化的频率来确定最合适的实现方式。是否应该将状态存储在表格中以便扩展工作流?是否应该将国
07-28
建设银行隐私计算实践
一、外部数据使用历史1、外部数据的定义外部数据指为满足业务发展从本行外部获取的支持客户营销、风险管控、管理决策、产品创新、运营优化
07-27
哔哩哔哩数据服务中台建设实践
一、数据服务中台建设背景1、数据获取过程中的痛点在分享数据服务中台建设之前,想从两个案例开始,从中可以感受传统数据获取过程中的一些
07-04
数据偏度介绍和处理方法
偏度(skewness)是用来衡量概率分布或数据集中不对称程度的统计量。它描述了数据分布的尾部(tail)在平均值的哪一侧更重或更长。偏度可以
05-31
企业如何使用规范性分析进行物流管理
  当在做出明智的决策时包含多个变量和不确定性时,企业将变得越来越难以进行有效的运营。  然而,随着Google和Netflix等行业巨头以及
05-31
使用数据治理框架的三个经验和教训
  全球首个对外发布的数据治理框架是GwenThomas的作品,Thomas是国际数据治理研究所(DGI)的创始人,她在2003年将其开发的数据治理框架发
05-30
读时建模技术在异构数据分析平台的应用
本文将从日志分析的价值和日志处理的难点和挑战入手,进而引出读时建模的技术理念,并介绍鸿鹄数据分析平台在设计和技术实现的时候,是如何
05-24
数据分析在设施管理和维护运营中的作用
数据分析是一门分析和处理原始数据以获得有意义且可操作的见解的科学,这些见解可用于为业务决策提供信息。什么是数据分析,为什么其在设施
05-11
为什么85%的大数据项目总是失败?
企业在推行大数据项目时往往把项目规模和范围做得很大,但是事实却是,很多大数据项目通常都会失败。2016年,Gartner估算约60%的大数据项目
05-11
如何搭建好的数据指标体系?
什么是好的指标?好的指标能带来你所期望的变化,指引大家朝着正确的方向去迭代:每个部门都朝着一个共同的目标协作前进,经过不断迭代优化
04-28
解密HDFS如何判断磁盘存储大小,存储动态负载均衡的?
DataNode在运行过程中,为了计算DN的capacity使用量,实现数据存储的动态均衡,DN会对已配置的数据存储路径(dfs datanode data dir)进行d
04-27
数据治理与数据中台架构
随着工业 4 0 时代的到来,传统行业的数字化转型是大势所趋;将数据提高到数据要素层面,让传统的技术在新的场景下发挥出新的作用,是近
04-23
2023年高级数据科学家必须掌握的十个技能
这篇文章将会带你一起探索高级数据科学家所需要的十项Top级技能。想在任何行业中成为佼佼者,不断学习一些必要技能是非常重要的。当然,这
04-21