使用方便
可用于 Java、Scala、Python 和 R。
MLlib 適合Spark的 API,并與 Python(從 Spark 0.9 開始)和 R 庫(從 Spark 1.5 開始)中的NumPy互操作 。您可以使用任何 Hadoop 數據源(例如 HDFS、HBase 或本地文件),從而輕松插入 Hadoop 工作流。
表現
高質量算法,比 MapReduce 快 100 倍。
Spark 擅長迭代計算,使 MLlib 能夠快速運行。同時,我們關心算法性能:MLlib 包含利用迭代的高質量算法,并且可以產生比有時在 MapReduce 上使用的單遍近似更好的結果。
無處不在
Spark 在 Hadoop、Apache Mesos、Kubernetes 上運行,或在云中針對不同的數據源運行。
您可以使用其集群模式在EC2、Hadoop YARN、Mesos或Kubernetes上運行 Spark 。訪問HDFS、?Apache Cassandra、?Apache HBase、?Apache Hive和數百個其他數據源?中的數據。
數據評估
關于MLlib(ApacheSpark)特別聲明
本站OpenI提供的MLlib(ApacheSpark)都來源于網絡,不保證外部鏈接的準確性和完整性,同時,對于該外部鏈接的指向,不由OpenI實際控制,在2023年 5月 13日 下午4:40收錄時,該網頁上的內容,都屬于合規合法,后期網頁的內容如出現違規,可以直接聯系網站管理員進行刪除,OpenI不承擔任何責任。
相關導航
暫無評論...