首頁 > 大數據 > 正文

加快數據科學項目的五個自動化工具

2019-09-19 14:00:53  來源:IT168網站編譯

摘要:數據科學影響了來自不同行業的許多企業。盡管數據科學已經成為“21世紀最吸引人的工作”,但還有一項技術正變得越來越突出。
關鍵詞: 大數據 自動化
  數據科學影響了來自不同行業的許多企業。盡管數據科學已經成為“21世紀最吸引人的工作”,但還有一項技術正變得越來越突出。
 
  如今,自動化不僅應用于機器人領域,它還與其他領域相結合,使技術人員的工作變得更容易,其中一個領域就是數據科學。有很多公司正在為數據科學領域開發工具和產品。在本文中,我們將研究數據科學專業人員可以使用的一些自動化工具。
 
  加快數據科學項目的五個自動化工具
 
  1. Auto-Weka
 
  有幾種機器學習算法可以直接使用,其中許多方法都是在Weka包中實現的。然而,每一種ML算法都有自己的超參數,這些超參數可以極大地改變它們的性能,而且總體上有大量可能的替代方法。
 
  Auto-WEKA最初于2013年發布,它考慮通過同時選擇學習算法和設置超參數來解決這個問題。它還解決了使用貝葉斯優化的問題。Auto-Weka還致力于幫助非專業用戶更有效地識別適合其應用程序的ML算法和超參數設置。
 
  2. Darwin
 
  Darwin是一家建立人工智能系統以推動最重要利益的公司Sparkcognition開發的,是另一個大規模解決數據科學問題的工具。 它是一種自動化的模型構建工具,允許用戶在比傳統方法更短的時間內從數據到模型。此外,它還可以實現場景的快速原型設計和高效的洞察力提取。
 
  這個工具是如何工作的?該工具使用基于神經進化的方法,自定義構建模型架構,以確保最適合目前的問題。
 
  3.DataRobot自動機器學習
 
  DataRobot是一個先進的企業AI平臺。該平臺融合了一些世界領先的數據科學家的知識、經驗和最佳實踐。談到自動化,DataRobot的自動化機器學習平臺,幫助ML開發人員以前所未有的透明度自動創建機器學習模型,以幫助理解和信任他們所做的預測。該平臺配備了不同類型的回歸技術,從最簡單的統計經典回歸模型到復雜的統計經典回歸模型。此外,這個平臺最好的一點是,它還可以解決多達100個不同類別的簡單問題。
 
  從一開始,DataRobot就一直是數據科學專業人士追捧的平臺。要了解這個平臺的更多信息,您可以查看他們的官方產品網站。
 
  加快數據科學項目的五個自動化工具
 
  4. H20.ai
 
  在機器學習自動化方面,H2O已經成為領導者。它是一個開源的分布式內存機器學習平臺,具有線性可伸縮性。該平臺的創建方式支持大多數廣泛使用的統計和機器學習算法。
 
  這個平臺最棒的地方之一是,它具有業界領先的AutoML功能,可以自動運行所有算法及其超參數,生成排行榜的最佳模型。
 
  5. dotData
 
  特性工程被認為是數據科學專業人員最重要、最耗時和最具挑戰性的工作之一。打包了最好的人工智能功能的dotData致力于將其自動化。簡單地說,該公司只專注于民主化和自動化整個數據科學工作流。
 
  與傳統流程相比,在識別用例到將流水線投入生產之間可能需要數月時間,此AI / ML平臺有助于快速,大規模地執行復雜的數據科學項目。

第二十九屆CIO班招生
法國布雷斯特商學院MBA班招生
法國布雷斯特商學院碩士班招生
法國布雷斯特商學院DBA班招生
責編:baiyl
重庆时时新版走势图