色综合图-色综合图片-色综合图片二区150p-色综合图区-玖玖国产精品视频-玖玖香蕉视频

您的位置:首頁技術文章
文章詳情頁

Python 數據化運營之KMeans聚類分析總結

瀏覽:64日期:2022-08-06 17:28:13
目錄Python 數據化運營1、內容介紹2、一般應用場景3、聚類的常見方法4、Keans聚類實現5、聚類的評估指標6、聚類效果可視化7、數據預測Python 數據化運營1、內容介紹

以 Python 使用 Keans 進行聚類分析的簡單舉例應用介紹聚類分析。

聚類分析 或 聚類 是對一組對象進行分組的任務,使得同一組(稱為聚類)中的對象(在某種意義上)與其他組(聚類)中的對象更相似(在某種意義上)。它是探索性數據挖掘的主要任務,也是統計數據分析的常用技術,用于許多領域,包括機器學習,模式識別,圖像分析,信息檢索,生物信息學,數據壓縮和計算機圖形學。

2、一般應用場景

(1)目標用戶的群體分類:根據運營或商業目的挑選出來的變量,對目標群體進行聚類,將目標群體分成幾個有明顯的特征區別的細分群體,在運營活動中為這些細分群體采用精細化、個性化的運營和服務,提升運營的效率和商業效果。

(2)不同產品的價值組合:按特定的指標變量對眾多產品種類進行聚類。將產品體系細分成具有不同價值、不同目的、多維度產品組合,在此基礎上制定相應的產品開發計劃、運營計劃和服務計劃。

(3)探索、發現孤立點及異常值:主要是風控應用。孤立點可能會存在欺詐的風險成分。

3、聚類的常見方法

分為基于劃分、層次、密度、網格、統計學、模型等類型的算法,典型算法包括K均值(經典的聚類算法)、DBSCAN、兩步聚類、BIRCH、譜聚類等。

4、Keans聚類實現

import numpy as npimport matplotlib.pyplot as pltfrom sklearn.cluster import KMeansfrom sklearn import metricsimport random# 隨機生成100組包含3組特征的數據feature = [[random.random(),random.random(),random.random()] for i in range(100)]label = [int(random.randint(0,2)) for i in range(100)]# 轉換數據格式x_feature = np.array(feature)# 訓練聚類模型n_clusters = 3 # 設置聚類數量model_kmeans = KMeans(n_clusters=n_clusters, random_state=0) # 建立聚類模型對象model_kmeans.fit(x_feature) # 訓練聚類模型y_pre = model_kmeans.predict(x_feature) # 預測聚類模型y_pre

實現如圖:

Python 數據化運營之KMeans聚類分析總結

5、聚類的評估指標

inertias 是K均值模型對象的屬性,表示樣本距離最近的聚類中心的總和,它是作為在沒有真實分類結果標簽下的非監督式評估指標。該值越小越好,值越小證明樣本在類間的分布越集中,即類內的距離越小。

# 樣本距離最近的聚類中心的總和inertias = model_kmeans.inertia_

adjusted_rand_s:調整后的蘭德指數(Adjusted Rand Index),蘭德指數通過考慮在預測和真實聚類中在相同或不同聚類中分配的所有樣本對和計數對來計算兩個聚類之間的相似性度量。調整后的蘭德指數通過對蘭德指數的調整得到獨立于樣本量和類別的接近于0的值,其取值范圍為[-1, 1],負數代表結果不好,越接近于1越好意味著聚類結果與真實情況越吻合。

# 調整后的蘭德指數adjusted_rand_s = metrics.adjusted_rand_score(label, y_pre)

mutual_info_s:互信息(Mutual Information, MI),互信息是一個隨機變量中包含的關于另一個隨機變量的信息量,在這里指的是相同數據的兩個標簽之間的相似度的量度,結果是非負值。

# 互信息mutual_info_s = metrics.mutual_info_score(label, y_pre)

adjusted_mutual_info_s:調整后的互信息(Adjusted Mutual Information, AMI),調整后的互信息是對互信息評分的調整得分。它考慮到對于具有更大數量的聚類群,通常MI較高,而不管實際上是否有更多的信息共享,它通過調整聚類群的概率來糾正這種影響。當兩個聚類集相同(即完全匹配)時,AMI返回值為1;隨機分區(獨立標簽)平均預期AMI約為0,也可能為負數。

# 調整后的互信息adjusted_mutual_info_s = metrics.adjusted_mutual_info_score(label, y_pre)

homogeneity_s:同質化得分(Homogeneity),如果所有的聚類都只包含屬于單個類的成員的數據點,則聚類結果將滿足同質性。其取值范圍[0,1]值越大意味著聚類結果與真實情況越吻合。

# 同質化得分homogeneity_s = metrics.homogeneity_score(label, y_pre)

completeness_s:完整性得分(Completeness),如果作為給定類的成員的所有數據點是相同集群的元素,則聚類結果滿足

完整性。其取值范圍[0,1],值越大意味著聚類結果與真實情況越吻合。# 完整性得分completeness_s = metrics.completeness_score(label, y_pre)

v_measure_s:它是同質化和完整性之間的諧波平均值,v = 2 (均勻性 完整性)/(均勻性+完整性)。其取值范圍[0,1],值越大意味著聚類結果與真實情況越吻合。

v_measure_s = metrics.v_measure_score(label, y_pre)

silhouette_s:輪廓系數(Silhouette),它用來計算所有樣本的平均輪廓系數,使用平均群內距離和每個樣本的平均最近簇距離來計算,它是一種非監督式評估指標。其最高值為1,最差值為-1,0附近的值表示重疊的聚類,負值通常表示樣本已被分配到錯誤的集群。

# 平均輪廓系數silhouette_s = metrics.silhouette_score(x_feature, y_pre, metric=’euclidean’)

calinski_harabaz_s:該分數定義為群內離散與簇間離散的比值,它是一種非監督式評估指標。

# Calinski和Harabaz得分calinski_harabaz_s = metrics.calinski_harabasz_score(x_feature, y_pre) 6、聚類效果可視化

# 模型效果可視化centers = model_kmeans.cluster_centers_ # 各類別中心colors = [’#4EACC5’, ’#FF9C34’, ’#4E9A06’] # 設置不同類別的顏色plt.figure() # 建立畫布for i in range(n_clusters): # 循環讀類別 index_sets = np.where(y_pre == i) # 找到相同類的索引集合 cluster = x_feature[index_sets] # 將相同類的數據劃分為一個聚類子集 plt.scatter(cluster[:, 0], cluster[:, 1], c=colors[i], marker=’.’) # 展示聚類子集內的樣本點 plt.plot(centers[i][0], centers[i][1], ’o’, markerfacecolor=colors[i], markeredgecolor=’k’, markersize=6) # 展示各聚類子集的中心plt.show() # 展示圖像

如圖:

Python 數據化運營之KMeans聚類分析總結

7、數據預測

# 模型應用new_X = [1, 3.6,9.9]cluster_label = model_kmeans.predict(np.array(new_X).reshape(1,-1))print (’聚類預測結果為: %d’ % cluster_label)

到此這篇關于Python 數據化運營之KMeans聚類分析總結的文章就介紹到這了,更多相關Python 數據化運營內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網!

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 亚洲欧美一区二区三区在线播放 | 亚洲精品一区二区三区美女 | 日本欧美一级二级三级不卡 | 亚洲在线偷拍自拍 | 国产欧美在线观看不卡 | 5x社区直接进入一区二区三区 | 日日狠狠久久偷偷四色综合免费 | 精品伊人久久久久网站 | 日本久久精品视频 | 免费在线亚洲视频 | 精品亚洲成a人片在线观看 精品亚洲成a人在线播放 | 亚洲国产一区二区三区四区五区 | 久久精品视频3 | 精品一区二区三区免费爱 | 97视频免费公开成人福利 | 成人黄网18免费观看的网站 | 成人精品一区二区www | 多人伦精品一区二区三区视频 | 成人国产在线24小时播放视频 | 一区二区三区成人 | 国产麻豆一级在线观看 | 国产精品久久久久久久久免费hd | 免费一区二区三区视频狠狠 | 国产精品分类视频分类一区 | 中文字幕在线视频在线看 | 玖玖99视频 | 女人扒开双腿让男人捅 | 在线久久| 色久综合网 | 精品一区二区在线观看 | 亚洲精品国产一区二区 | 亚洲人成在线影院 | 真正免费一级毛片在线播放 | 午夜毛片免费观看视频 | 老王午夜69精品影院 | 久久精品国产99久久99久久久 | 97国产在线视频 | 免费ab| 97一级毛片全部免费播放 | 国产成人免费高清视频网址 | 国产成人精品免费久久久久 |