Informatica走得更深入一步
许多数据集成和数据管理厂商(IBM、甲骨文、Syncsort和Talend)处理的是很明显的任务:让数据进出Hadoop。Informatica公司在去年10月则更深入一步,当时它推出了HParser,这是一种针对Hadoop而优化的数据转换环境。据Informatica声称,软件支持灵活高效地处理Hadoop里面的任何文件格式,为Hadoop开发人员提供了即开即用的解析功能,以便处理复杂而多样的数据源,包括日志、文档、二进制数据或层次式数据,以及众多行业标准格式(如银行业的NACHA、支付业的SWIFT、金融数据业的FIX和保险业的ACORD)。正如数据库内处理技术加快了各种分析方法,Informatica同样将解析代码添加到Hadoop里面,以便充分利用所有这些处理功能,不久会添加其他的数据处理代码。
Karmasphere玩转Hadoop数据分析
来自传统商业智能领域的众多厂商(Jaspersoft、Pentaho、Tableau Software及其他公司)现在将其工具和技术对准了Hadoop这一数据源。但是自2010年以来,Karmasphere公司就一直在帮助数据专业人员挖掘和分析Hadoop里面的互联网、移动设备、传感器和社交媒体等数据。
Karmasphere提供了直接访问Hadoop里面结构化和非结构化数据的优点,它还可以运用SQL及其他语言,用于即席查询和进一步的分析。Karmasphere Analyst是核心协作工作区,以便数据专业人员和数据分析员可以直接访问Hadoop里面的结构化和非结构化数据。使用SQL及其他语言,用户就能创建即席查询,然后处理结果。Karmasphere Studio为开发人员提供了一种图形化环境,可以在里面开发自定义算法,为应用程序和可重复的生产流程创建实用的数据集。 Karmasphere与Hadoop领域的多家知名厂商达成了合作关系,面向亚马逊弹性MapReduce的Karmasphere Analyst和Karmasphere Studio将相关工具运用到了这主要的基于云的MapReduce服务之一。