Netflixのユーザーの視聴データがあったとして、
どの映画を見たのかを表すデータを使うと映画タイトルの
全てが表示され、凄まじい量になる。
基本的にNetflixユーザーは全部の映画を見るわけではないので
当然データセットは0だらけになる
sparse matrixではデータセットが0以外のものの
arrayの位置を返す
1 2 3 4 5 6 7 8 9 10 11 12 13 |
# Load libraries import numpy as np from scipy import sparse # Create a matrix matrix = np.array([[0, 0], [0, 1], [3, 0]]) # Create compressed sparse row (CSR) matrix matrix_sparse = sparse.csr_matrix(matrix) print(matrix_sparse) |
結果
1 2 |
(1, 1) 1 (2, 0) 3 |