产品展示
欧陆娱乐云和AI时代数据库将面临哪些挑战
随着云和AI(人工智能)技术发展,越来越多的应用不再局限于纯文本来生成回答,涉及的数据类型日益复杂,并且常存储于IT架构的不同数据库中,这对数据库提出了新的要求,包括提升性能与响应速度,要求数据库处理和存储不同类型的数据,并支持结构化、半结构化及非结构化数据的复杂融合查询。
那么,云和AI时代,需要怎样的数据库?在近日召开的OceanBase2024年度发布会上,来自政府、高校、企业的数据库专家认为,伴随着互联网/移动互联网时代向云和AI时代演进,数据库也正从分散走向统一,一体化数据库将成为云和AI时代的数据底座。
随着越来越多的AI应用扩展到超越纯文本生成和回答,多模态应用程序变得愈发普遍,它们不仅能够处理文本,还能处理图像、音频、视频等复杂非结构化数据。这些数据类型通常分散在企业IT架构的不同数据库中,并通过不同的管道访问,使得使用它们的过程既困难又繁琐。
面对这种复杂性,AI时代的数据处理呈现出以下新特征,并对数据库提出了新的挑战:一方面,随着实时数据分析和决策的需求增加,数据库必须能够快速处理大量数据,以支持实时应用,如在线推荐和动态定价。这对传统数据库在性能和响应时间上提出了更高要求。
另外,AI应用生成的数据量大且类型多样(结构化、半结构化和非结构化),数据库需要具备处理和存储不同类型数据的能力,要求支持多模架构,以满足多模态的数据需求;其次,AI应用对复杂数据分析提出更高的需求,数据库需要支持复杂SQL查询优化,提升查询性能,以满足深度学习和机器学习模型的训练与预测需求;最后,不同来源的数据需要进行融合处理,以获取更全面、更准确的信息。
华东师范大学数据学院院长钱卫宁表示,数据库技术经历了漫长的发展过程,从关系型数据库发展到今天已经超过45年,数据库最早其实是解决封闭环境下的关键核心问题,而今天数据进入了开放互联网时代,在线用户的规模变得不可控,用户使用数据的方式变得多样化,某种程度来说也是不可控的。在开放环境下需要有新的数据库系统,该系统应该是分布式数据库、高可用的数据库欧陆娱乐。
OceanBase创始人、首席科学家阳振坤指出,由于便捷、易用提高了企业的效益,云成了一个时代的主旋律,但在数据库领域还有很大的发展空间,主要存在的问题是单机、单模、单云。一方面,数据库虽然经过了半个多世纪的发展,但今天的主流数据库还是单机系统,受制于很多的原因,单机系统很难处理大数据,分布式是最有效的手段;其次,现在做事务处理有事务处理数据库,做分析处理有分析处理数据库,文档有文档处理的数据库,用户要花大量的精力和成本做各个系统之间的各种数据同步,把数据从交易数据库拖到分析数据库以及下游大平台数据库上做处理。
“此外,每个云平台的数据库本质上只能在这个云平台用,但是对于用户来讲其实是需要更多的选择,还有从容灾、故障方面考虑,很多业务希望有跨云的部署,但是现如今哪怕是同样一个数据库要做跨云的部署,这对业务来讲可能是巨大的风险。”阳振坤表示。
随着互联网/移动互联网时代向云和AI时代演进,数据库又将如何演进?中国人保601319)财险科技运营部副总经理张帆表示,目前AI的应用跟数据库直接的关联不是特别大,主要是由于现在的数据库产品可能先天上缺少面向AI的设计考量。未来可能会有更多的融合场景和需求,数据库产品增强面向AI的专属能力,或许是其未来发展一个比较重要的方向。
中国联合航空有限公司信息中心总经理冯振宇认为,AI跟数据库的关系欧陆娱乐,更像是马和鞍,好马得配好鞍。现在好马有了,鞍子可能还差点,属于大家还在摸索的阶段。目前对AI数据库的想法、理念,实际上还是在AI上,没有在数据库上,未来数据库发展还要与AI进程相匹配。
IDC中国副总裁兼首席分析师武连峰分析指出,未来数据库发展,无非是两个层面:一个是AI for DB(AI应用于数据库),让数据库管理人员欧陆娱乐、开发人员甚至普通用户,就可以用自然语言对话,大大简化数据的查询,这是一个方向;另一个是DB for AI(数据库服务于AI),数据库支持向量、支持IAT等检索生成,使整个数据库未来给业务人员反馈的结果更加精确。
OceanBase CEO杨冰表示,“数据库也正从分散走向统一,一体化数据库将成为AI时代的数据底座。如何通过一个统一的数据库来处理所有类型的数据,并通过向量融合查询能力,让小团队也可以快速构建AI应用,是我们一体化产品战略在AI时代的核心思考。”
据悉,一体化数据库是一种能够处理多种工作负载、数据类型及场景的数据库系统,旨在通过一个数据库满足企业各种复杂的数据需求,简化技术栈,提升效率并应对日益复杂的数据需求。这种数据库通常具备事务处理(TP)和分析处理(AP)能力,支持多模数据处理(如JSON、XML、GIS、文档等),并兼容多种主流数据库协议(如MySQL和Oracle),让用户能够在一个数据库上满足多样化的数据处理需求。