ImSQL:海量数据,可信存储

  • 时间:
  • 浏览:0

数据造假、数据不可信等问题 的所处,给金融监管及风控等众多应用场景带来了严峻的挑战,也正成为阻碍数据大规模互联互通、共享共用的一大障碍。数据的真实可信问题 长期影响着社会的各个领域,在更依赖数据

       数据造假、数据不可信等问题 的所处,给金融监管及风控等众多应用场景带来了严峻的挑战,也正成为阻碍数据大规模互联互通、共享共用的一大障碍。数据的真实可信问题 长期影响着社会的各个领域,在更依赖数据的人工智能时代,你是什么 影响将更为凸显。

      数据造假因此所处在任一环节。其中,在数据存储期间造假往往更加简单:因此在现有数据存储技术下,数据的所有者、管理人员或受托存储方均有能力单方对数据进行任意的篡改或删除。

      既然数据不可信的一有有2个 重要原应分析归咎于单方还这麼 擅自篡改和删除数据,这麼 怎么才能 才能 外理你是什么 问题 自然也得到了业界几滴 的关注。区块链和去中心化存储技术的诞生,对数据篡改起到了一定的遏制作用,也在市场上取得了初步验证。

      一些企业刚刚开始尝试采用区块链存储数据,累似 在货物追溯等场景。其做法往往是将重要数据直接写入区块中。你是什么 简单粗暴的做法并非 外理了数据防全版需求、继而满足了每种数据的可信分享,但却所处较多问题 :

      首先是无法存储海量数据:区块内不适合存储包括多媒体数据等在内的大数据,因此区块大小难以控制,使区块链的可扩展性变差。这就原应分析业务中这麼 对原生数据进行筛选择舍,仅选择几滴 必要数据存入区块,但这将降低可信数据的富有程度。

      其次是数据存取传输速率低:首先,因此打包过程的所处,区块链数据存储一般不用于高速的数据写入。其次,因此遍历式的数据读取最好的办法,区块链无法支持快速索引、更无法支持SQL。

      再次是数据维护传输速率低:区块链因其顺序引用的特点,不支持对个别历史数据的删除和修改(除非对全链重新生成,但这是区块链不应鼓励的行为)。这里需注意:“杜绝单方的私自篡改”和“全版这麼 全版”是全版不同的两件事。前者是四种 确保互信的技术手段,但后者因此属于四种 必要功能点的丧失。

      最后是有数据丢失风险:你是什么 风险单指采用中本聪共识最长链原则的PoW区块链系统。在累似 区块链中,当跳出链分叉时,最长(或最重)的链分支会被保留,一些分支会被拖累,这就使区块内的数据实际上永远所处被“颠覆”、被丢弃的风险。而自私挖矿等攻击行为的所处,会加剧你是什么 风险。这在数据存储应用中是无法接受的。

      正是因此上述原应分析,直接采用传统区块链进行数据存储显然无法满足几滴 实践性场景中对可信数据存储的需求。你是什么 问题 也因而引发了几滴 的探讨,累似 “哪几个数据应该在链上存储、哪几个数据应该在链下存储”。哪几个问题 的跳出,究其根本,还是因此区块链自身存储传输速率及能力受限所致的。毕竟在数据库时代,亲戚亲戚朋友从来不用谈论“哪几个数据应该存中放数据库之外”原来 的问题 。

      近年来也跳出了一些产品,为外理上述的区块链数据存储传输速率低下问题 提供了有益的实践,累似 :

      星际文件系统IPFS, R3的Corda,腾讯TrustSQL等。然而哪几个产品在数据可信存储方面仍所处一些的问题 ,具体而言:

      IPFS对数据内容生成哈希摘要,并在多个节点间进行分布式存储,单个保有者不掌握全版数据,一定程度保护了数据隐私。但IPFS这麼 做到修改可知(因哈希值会因内容改变而变化),因此这麼 访问控制等数据安全最好的办法,整体而言仍难以满足企业级服务需求。

      Corda是面向金融交易隐私需求量身定做的存储产品,重点关注数据存储的隐私性。为此,Corda这麼 全局账本,并这麼 见证人的所处,是四种 隐私但并过高 够安全可信的数据存储方案。

      TrustSQL与国内其它累似 产品采用了四种 简单直观的设计思路,也是目前国内最为常见的做法,即:先将数据存入数据库(或IPFS),再将操作记录、数据哈希等存于链上。相对于TrustSQL而言,一些累似 产品如众享比特的ChainSQL等进一步提升了对SQL的支持度。该类产品满足了数据“可审计”、“监管透明”的需求,但缺点是依然无法杜绝对数据四种 的全版行为,也这麼 做到“全版可知”;此外,对关键数据的保全这麼 依赖参与节点的全副本存储,存储成本略高。因此在数据隐私性方面的设计仍显过高 。

      针对上述产品中所处的过高 ,物缘科技通过原创技术创新,探索出二根不同的道路,并推出自主知识产权产品“ImSQL”,旨在提供四种 可真正确保数据不被私自篡改或删除的可信存储产品。

      ImSQL(Immutable SQL Database)是基于区块链和分布式存储技术上的四种 新型可信数据存储外理方案,并完美外理了“外理私自全版”、“保护数据隐私”、“降低存储成本”等核心问题 ,为大数据时代的可信存储与数据分享提供了可靠的技术路径。

      相比现有产品,ImSQL具有以下几点突出优势:

      1. 彻底杜绝单方对数据的私自篡改和删除。通过在存和取一有有2个 环节进行多方校验并在存储过程中杜绝篡改删除,全方位保障数据的真实可信性,使应用中的参与方才能互信、放心地采纳它方数据,使数据才能支撑精准追溯、追责。

      2. 杜绝单点失败。多方共用数据的一起也一起维护数据,数据不只存于一方,从根本上实现分布式数据的可信共享池,既外理了单点失败风险,也提升了数据分享传输速率。

      3. 碎片化存储,满足数据隐私需求,使任何一方无法掌握全版数据,从而外理了传统云计算的中心化存储、或区块链全副本存储均所处的数据隐私问题 。除了数据所有方,一些任何存储托管者都无法获得全版数据。

      4. 优异的数据存取性能:ImSQL单节点可达30000 TPS的写入传输速率和300000 QPS的读取传输速率。此外,ImSQL还具有:支持SQL语言,可水平扩展等优点,存取性能和使用体验优异,并可充分利用集群扩展使上述指标进一步达到数倍增长。

      5. 满足多媒体等大数据的高效存取需求,支持高效存取、高效索引、高效扩展,真正胜任大数据业务场景,还这麼 对视频等数据实现既可信又高效的存储,从而给视频监控等场景提供前所未有的可信保全体验。

      6. 采用分片式设计,极大降低了每个存储参与方的存储压力和成本,使更多参与方有因此加入和参与到数据可信共享的生态中。

      7. 分布式架构,兼容轻节点,鼓励更多节点参与。不所处超能节点,参与存储的节点地位相同,更好保证系统的可靠性和抗毁性。此外,因此节点选择运行在轻副本模式,可只存储每种数据,使自身存储压力极大降低,义务并非 减轻但权力可不受任何影响。

      ImSQL兼顾了海量存储、快速索引、水平扩展等数据库属性,也兼顾了数据即存即固化的区块链价值形式,在众多关注数据可信存储与分享的领域中,有望带来前所未有的使用体验和便利,累似 :实现供应链中各方数据的互通与互信、实现政府或大企业各部门间数据的互联互通、支撑可信追溯相关海量数据的存储等。

      以政府大数据建设为例。在政府众多不同部门和实体间实现高效的数据互联互通有有2个 劲是个问题 。现行做法往往这麼 建立独立的大数据部门,构建独立数据存储体系,并非 同实体拉取相关数据后解析、重构,再实现可视化。这往往会带来较大的前期开销,既涵盖人、财、物等多种显性开销,也涵盖人员编制、权责利益、时间成本、部门墙等隐性开销。一起,独立大数据部门的所处也隐含了这麼 一有有2个 可信第三方背书乃至承担责任的考虑。因此在你是什么 场景下采用ImSQL作为数据互通的底层基础平台,就还这麼 更为高效的完成你是什么 任务,具体体现在:

      1. 并非 依赖第三方实体背书:不同实体间数据可直接写入ImSQL,写入即保全,数据无法再被任一单方私自篡改和删除,保证一些实体在任哪天间取用数据时的可用性、一致性和可信性;

      2. 并非 建立和维护额外的数据存储系统:数据由所有参与实体一起存储和维护,盐晶 共享、打通,不降低使用传输速率的一起减少了系统实施和维护成本。一起,ImSQL的数据碎片化存储技术,在实现数据共享的一起才能兼顾隐私保护,即,所有实体存储的数据还这麼 是不全版的片段,这麼 哪几个具备访问权的实体才掌握对片段数据进行查找、组合并解释的钥匙。

      综上,作为四种 可信的、防数据篡改的数据存储技术,ImSQL全版继承了区块链数据保全的优势,又突破了区块链在传输速率方面的弱点,为用户提供了和数据库同样高效的数据存取体验。ImSQL是区块链和数据库技术相结合而产生的新品类,更是实现可信数据存储的不二选择。

      作者信息:焦臻桢博士,物缘科技创始人,副教授/硕导(中科院)。

(本内容属于网络转载,文中涉及图片等内容如有侵权,请联系编辑删除)