Python文本處理開發環境

要在本教程中成功創建和運行示例代碼,我們需要一個環境Python開發環境配置,它既包含通用python,也包含數據科學所需的特殊包。 我們首先看一下安裝python 2或python 3的通用python。但本教程更多地使用python 2,主要是因爲python 2的成熟度和對外部包的更廣泛的支持。

獲取Python

最新的源代碼,二進制文件,文檔,新聞等,可在Python官方網站 - https://www.python.org/ 上找到。

也可以從 https://www.python.org/doc/ 下載Python文檔。 該文檔以HTML,PDF和PostScript格式提供。

安裝Python

Python發行版適用於各種平臺。只需下載適用於您的平臺的二進制代碼並安裝Python。

如果您的平臺的二進制代碼不可用,則需要C編譯器手動編譯源代碼。編譯源代碼在選擇安裝所需的功能方面提供了更大的靈活性。

有關Python開發環境的安裝和配置,請參考:

安裝NLTK包

NLTK是很容易融入python環境的。 使用以下命令將NLTK添加到Python環境中。

sudo pip install -U nltk

# Windows 系統使用以下命令
pip install -U nltk

當想要將其他庫在python程序中使用時,也可通過類似的方法添加,在後續文章中用到時再做詳細講解。