数据软件即服务:混合部署架构的案例

As founders of companies that build solutions designed to help teams deliver on the promise of data在美国,推荐一个正规滚球网站知道推荐一个正规滚球网站想要为客户打造易于部署和管理的伟大产品. 

推荐一个正规滚球网站也知道,因为推荐一个正规滚球网站将与客户的数据栈集成, 推荐一个正规滚球网站需要提供最高级别的安全和合规. 问题是:推荐一个正规滚球网站将如何建造它们? SaaS? On-prem? 其他的东西?

为了实现这些目标,推荐一个正规滚球网站做出了选择 混合部署架构,这是一种将在线安全与SaaS便利性结合起来的新方法. 这是为什么. 

越来越多的数据 being ingested 和 stored by your company than ever before 和 increased scrutiny around how this data is accessed 和 used, layering in any type of new third-party solution to your existing data infrastructure implicitly comes with its fair share of security concerns.  

事实上, 在GDPR时代, CCPA, HIPAA和许多其他重要的缩写, managing complex data systems 和 keeping sensitive data secure are two distinct problems that don’t have a one-size-fits-all solution.

For data leaders, choosing which problem to address can feel like an exercise in picking your poison. 

传统的on-prem部署模型

on-prem部署架构, 第三方软件在客户环境中运行, 以速度和操作效率为代价提供更高的安全性. 图片由作者提供.

On-premises (on-prem) refers to the traditional deployment model in which the software runs in the customer’s environment, 通常在一个专用的VPC内. 特别是,服务存储或处理的所有数据都保留在客户的云中. 

好处 

在供应商编写代码的同时,客户维护数据的完全控制权和所有权. 

On-prem solutions provide customers a binary 和 a license key (in the case of licensed software), 客户管理部署. 它是无数软件产品所选择的传统部署模型. 例如MemSQL和Splunk的早期on-prem产品, 并依赖客户的工程和IT团队来处理部署. 与SaaS解决方案相比, on-prem platforms often provide greater customization 和 configuration based on the customer’s needs. 

为客户, an obvious benefit of choosing a vendor that leverages an on-prem architecture is rooted in perceived security 和 compliance. 通过将数据保存在客户的环境中, on-prem体系结构不向外部方公开连接. 此外, the vendor cannot access any sensitive information since all of the data 和 software is housed in the customer’s cloud.

挑战

on-prem部署模型要求客户承担大部分 操作的开销. 客户必须对灾难恢复情况进行故障排除, 例如应用程序停机和数据停机, 哪些会耗费大量时间,导致体验不佳. 

on-prem模型的第二个限制是 缺乏speed-to-deployment,包括基线软件和任何未来的产品更新. 因为软件存在于客户的环境中, 升级可能是一个冗长乏味的过程,需要大量的许可和额外的资源. 

SaaS模型

Software-as-a-Service (SaaS) solutions offer off-the-shelf software hosted in the vendor’s cloud that can be provisioned 和 used instantaneously by customers. 在这个模型中, 软件由供应商运行和管理, 使用存储在供应商云中的客户数据. 由Salesforce率先推出的数据领域的最新例子还包括 雪花, , Chartio.

SaaS模型 is hosted in the vendor’s cloud environment 和 allows for quick deployment 和 easy updates, 但也引发了对数据安全和访问的额外担忧. 图片由作者提供.

好处

SaaS模型使得供应商可以很容易地进行更新, 推出新功能, 并在规模上解决常见的痛点, 而不是将改变推给单个客户的环境. 对许多人来说,这创造了更愉快的用户体验,通常成本更低. 这也扩展到软件的维护, 哪个被外包给最了解软件的供应商. 

挑战

当你把数据混在一起时, SaaS模型变得有点复杂, 特别是当它涉及到遵从性需求和数据锁定时. 

而任何自重的SaaS提供商都会对您的数据进行加密, 它仍然被锁在供应商的环境中. 作为一个结果, 许多客户不愿意(或出于监管原因), 无法)完全移交数据的管理和存储.

Even if a customer is comfortable signing away the responsibility for securely storing the data outside of their environment, 他们还是得接受这个事实 数据现在是完全锁定的,并在供应商的控制下.

So, what does it take to get the compliance 和 flexibility benefits of an on-prem solution with the ease-of-deployment 和 convenience of a SaaS vendor? 

推荐一个正规滚球网站相信现代数据产品会有更好的发展方向: 混合架构

混合部署模型 

在过去的十年里, 推荐一个正规滚球网站已经看到软件工程和DevOps团队在各个行业的影响力在上升 混合云架构 管理基础设施即服务应用程序,包括 New RelicAtlassian. 最近,许多数据软件供应商也做出了类似的设计决定. 

The hybrid architecture model leverages best practice from software engineering 和 DevOps architectures to combine the security of on-prem with the ease of a SaaS deployment. 图片由作者提供.

结合SaaS世界和现代数据栈的最佳世界, 数据软件的购买者应该考虑采用混合架构的解决方案. 该方法由两个部分组成:(1)一个由供应商管理的控制平面, (2)客户环境中的数据平面.

控制飞机

控制飞机 typically hosts the majority of the software’s business logic 和 h和les insensitive metadata. 它与数据平面通信,并委托敏感的操作(如处理), 存储或删除数据). 控制飞机 also provides web 和 API interfaces, monitors the health of the data plane. 控制飞机 runs entirely in the vendor’s environment 和 typically follows a multi-tenant architecture, though some vendors offer a single-tenant control plane (often for a price premium) that runs in a customer-dedicated, 完全隔离, VPC.

数据平面

数据平面通常处理和存储客户的所有敏感数据. 它必须能够接收来自控制平面的指令, 并传回关于其操作和运行状况的元数据. 从技术上讲, the interface between the control 和 data plane is often implemented by a thin agent that runs in the customer’s environment. Some vendors are even able to skip an agent altogether 和 fully leverage cross-cloud account IAM roles.

从本质上说,, separating the customer’s data from the managed software gives customers the agility of a SaaS product with the compliance 和 data ownership of an on-prem solution, 并始终将客户数据保存在客户的云环境中. 

更快的入职时间和价值

这种混合架构使客户能够快速地部署软件, 通常只需要很少的人工开销. 

同时, 这种快速的入职让客户可以从产品中获得近乎直接的影响, 在短期内, 他们的数据或ML模型的近直接价值. 

作为此部署模型的一部分, vendors with hybrid solutions typically provide on-call support as a key feature of their product — almost like an embedded SRE team for their customers. 

独立管理复杂的基础设施和敏感的客户数据

One of the biggest benefits of the hybrid model is that it frees customers from needing to configure or maintain the vendor’s complex infrastructure, 同时让客户完全控制他们的数据. 

One way to do this is to give the vendor access to the “data plane” through an agent or cross-account roles, 提取元数据等信息, 查询日志和汇总统计信息. 与许多SaaS产品不同, 没有任何个人记录或PII被从客户的数据仓库中取出, 湖泊, 或BI工具,并存储在供应商的云上. 

The hybrid approach also facilitates the addition of “knobs” that control the extent of account permissions for the vendor (i.e.对客户越宽容,对客户的管理就越少,反之亦然). 这让客户在数据访问和安全方面拥有更大的代理权, which is critical for industries such as FinTech 和 healthcare where sensitive data abounds 和 the margin of acceptable error is low to non-existent. 

通过让供应商管理服务的计算资源, it also ensures that any issues with the product can be quickly resolved by the vendor without burdening the customer. A data agent solves this problem 和 ensures the vendor’s infrastructure can be easily maintained, 调试, 无需客户的努力或资源就可以进行更新. 

为阅读这篇文章的供应商提供专业提示: 推荐一个正规滚球网站建议您尽早获得SOC2认证——您会感谢推荐一个正规滚球网站的. 许多企业, 特别是在GDPR, HIPAA, 和SOX合规行业, 在他们考虑和你合作之前会要求这个吗. 

快速、持续的软件升级 

混合部署模型保持了稳定的云原语,比如S3, EMR, DynamoDB在客户云和所有的不断改进, 快速移动的基础设施(i.e. 产品本身). 作为一个结果,  customers can integrate new solutions  into their data stack more easily as the cost of trying out 和 getting started with a hybrid-model vendor is significantly lower than it is for complex on-prem software. Hosting the service in the vendor’s environment also makes rolling out updates for all customers much easier 和 more seamless than if it were hosted in the customer’s private cloud.

Hosting the service in the vendor’s environment means that customers can get access to new features, 确保创新和产品开发不受孤岛驱动. 客户 don’t even have to be aware of different software versions 和 slow upgrade cycles anymore – they can rest assured that they’ll always be using the latest 和 greatest release, 完全自动.

混合模式为客户提供了如何选择使用产品的灵活性, 例如, 如果他们想要在整个堆栈中部署它,或者只在几个选定的数据环境中部署它, 并且可以根据需要轻松地添加或删除服务实例. 

为灵活、安全的数据栈绘制前进道路  

推荐一个正规滚球网站建立可以玩滚球的正规app和泰顿的时候,推荐一个正规滚球网站并不认识对方, 推荐一个正规滚球网站最终为推荐一个正规滚球网站的产品选择了类似的架构. This hybrid model ended up being critical in our ability to support data 和 ML organizations while also getting a seal of approval from security teams. 

通过利用混合SaaS/on-prem架构, 解决方案提供商可以构建易于部署的数据产品, 代表客户需要很少甚至没有运营开销, 促进完整的数据所有权,, 或许最重要的, 确保最大限度的数据安全和合规. 

在一天结束的时候,为什么你不能两者兼得呢? 

这篇文章被转载了 推荐一个正规滚球网站的博客.

有兴趣了解更多? 接触 Lior Gavish,联合创始人和首席技术官 蒙特卡罗, or 凯文Stumpf,联合创始人和首席技术官 推荐一个正规滚球网站