Python3 讀寫 UTF-16/UTF-16-LE 文字檔

【重點寫在前面】

讀檔時:

  • 用 encoding=’utf-16-le’ 讀取 UTF-16 文字檔時,會誤把檔頭(BOM,也就是’\ufeff’字元)讀進變數裡。
  • 用 encoding=’utf-16′ 讀取 UTF-16-LE 文字檔時,會發生錯誤,無法讀取;因為 python 會期待有一個檔頭。

寫檔時:

  • 用 encoding=’utf-16′ 寫檔時,會自動地在檔案內容前產生一個檔頭,並寫進檔案裡。
  • 用 encoding=’utf-16-le’ 寫檔時,不會自動地產生檔頭。

繼續閱讀 “Python3 讀寫 UTF-16/UTF-16-LE 文字檔"

廣告

Windows 找不到 Python?!

安裝 Anaconda3 之後,本以為天下從此美好。
沒想到從 Windows cmd.exe (命令題示字示)中竟然無法呼叫 python ?!

上網查了一下,才發現我在安裝時沒有勾選 “Add Anaconda to my PATH environment variable"。所以 Windows 無法在它的 PATH 環境變數中,找到相應的程式。

解法:把 python.exe 所在的資料夾加入 PATH 環境變數中。
先打開 Anaconda Prompt,鍵入 “where python" 按下 enter,即可得到 python.exe 的所在地:

>>> C:\Users\joe\AppData\Local\Continuum\Anaconda3

而 iPython 也在離它不遠的地方:

>>> C:\Users\joe\AppData\Local\Continuum\Anaconda3\Scripts

得到資料夾位置後,再來就是用 SETX 指令把它寫入環境變數之中。

SETX PATH "%PATH%;C:\Users\joe\AppData\Local\Continuum\Anaconda3"
SETX PATH "%PATH%;C:\Users\joe\AppData\Local\Continuum\Anaconda3\Scripts"

最後,記得要重新開啟一個 Windows cmd.exe (命令題示字示)喔!
如此才能正確我們剛剛設好的(新的) PATH 環境變數。

好好享用你的巨蟒吧!!(誤)

用 tar 來打包與壓縮/解壓縮

打包與壓縮(bzip2)

tar -jcv -f FileName.tar.bz2 DirName

解壓縮(bzip2)

tar -jxv -f FileName.tar.bz2 -C ParentDir

純粹打包

tar -cv -f FileName.tar DirName

說明上面所用的參數:j 是使用 bzip2 技術;c 是建立檔案(create);x 是解開(extract);v 是觀看壓縮/解壓縮過程

更詳細的說明,請參照:
http://note.drx.tw/2008/04/command.html#tar.bz2
http://linux.vbird.org/linux_basic/0240tarcompress.php#pack

PowerShell 筆記 – 迴圈與檔案

由於工作的關係,已經習慣使用 Linux bash 的工作程式來編輯(或修改)文字資料了。現在要我移到 Windows 上作業,實在很不習慣。
但還好現代的 Windows 有提供另一個比 cmd.exe 更強大、方便的環境:PowerShell

於是,我開始在 PowerShell 上重練基本功囉!!
第一個實用的基本功是:迴圈

## 記數迴圈:產生一個 2 到 5 的數列
for ($i=2; $i -lt 6; $i++){
echo $i
}

## 執行結果:
#2
#3
#4
#5

由此可知 PowerShell 的語法類似 C++ 與 bash 的綜合:

## 語法
for ($變數=初始值; $變數 -le 最大值; $變數++){ 重複性的操作 }

其中 -le 是"小於等於"運算子;另外還有"小於"(-lt)、"大於等於"(-ge)、與"大於"(-gt)。

繼續閱讀 “PowerShell 筆記 – 迴圈與檔案"