随着跨行业数字化转型的加速,越来越多的公司认识到其实时数据流中未开发的价值。企业流分析公司Streambased旨在帮助组织从这些持续的运营事件数据流中提取有影响力的业务见解。
在最近的AI &大数据博览会上,Streambased创始人兼首席执行官Tom Scott在接受采访时概述了该公司对流数据进行高级分析的方法。Streambased的基础是Apache Kafka,这是一个被财富500强公司广泛采用的开源事件流媒体平台。
斯科特解释说:“(卡夫卡)的不足之处在于大规模分析。虽然Kafka在应用程序和微服务之间可靠地传输大容量数据流,但直接在流数据上执行复杂的分析工作负载一直是一个挑战。
Streambased在Kafka之上添加了专有的加速技术层,使该平台适合于数据科学家和其他分析师想要执行的高要求分析用例。
由于这些连续流动的事件流为关键操作系统和核心业务功能提供动力,因此数据质量必须在准确性、及时性和结构方面达到高标准。通过利用这些现有的Kafka数据管道,Streambased确保其分析能力能够访问最新的、干净的、组织良好的数据。
展示了Streambased方法强大功能的用例包括金融服务中的欺诈检测。如果发生异常事务,分析人员可以快速查询类似或相关的事务进行调查——这对于纯流架构来说是困难和低效的。基于流的分析交互优化使用户能够在不中断工作流程的情况下快速收集上下文见解。
运营和分析数据平台的融合代表了一种有影响力的趋势,基于流的称为“流数据湖”运动
“我认为我们正处于流数据湖运动时期。通过流数据湖,我的意思是我们用于分析目的的数据系统和我们用于操作目的的数据系统之间的完全融合,”斯科特解释说。
最近的增强功能,如Kafka中的无限数据保留和本地流分析服务,为这种新范式奠定了基础。目前,Streambased仍然专注于通过无摩擦自助访问粒度实时数据来增强业务分析师的能力,而无需更改现有工具和流程。
作者:法瑞恩
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
声明:海森大数据刊发或者转载此文只是出于传递、分享更多信息之目的,并不意味认同其观点或证实其描述。若有来源标注错误或侵犯了您的合法权益,请作者与本网联系,我们将及时更正、删除,谢谢。电话:15264513609,邮箱:1027830374@qq.com
2024-01-16 13:26:34
法瑞恩