在做 learning 的時候會需要先把 pandas 的 dataframe 的 order 打亂,有幾種方法可以做到,稍微紀錄一下,我個人是比較喜歡 sklearn 的方法啦…
以下要在 jupyter notebook 或 python script 裡執行, assume 已經安裝 pandas 並 import
mlcc 裡的方法
1 | > california_housing_dataframe = california_housing_dataframe.reindex(np.random.permutation(california_housing_dataframe.index)) |
sample 法
1 | > california_housing_dataframe = california_housing_dataframe.sample(frac=1).reset_index(drop=True) |
sklearn shuffle 法
1 | > from sklearn.utils import shuffle |