UTF-8編碼文件去掉BOM的PHP代碼

2013-04-20 19:53:42來源:西部e網(wǎng)作者:

有些朋友在轉(zhuǎn)換文件編碼的時候會出現(xiàn)一些奇怪的問題,記得有一次我轉(zhuǎn)換了程序文件編碼,竟然導(dǎo)致網(wǎng)頁瀏覽的時候頂部出現(xiàn)一行空白。用文本編輯器也看不出來問題,后來一查發(fā)現(xiàn)竟然是“UTF-8有簽名”(UTF8 with BOM)

有些朋友在轉(zhuǎn)換文件編碼的時候會出現(xiàn)一些奇怪的問題,記得有一次我轉(zhuǎn)換了程序文件編碼,竟然導(dǎo)致網(wǎng)頁瀏覽的時候頂部出現(xiàn)一行空白。用文本編輯器也看不出來問題,后來一查發(fā)現(xiàn)竟然是“UTF-8有簽名”(UTF8 with BOM)。

那么,如何將帶有BOM文件的格式轉(zhuǎn)換成無簽名的UTF-8格式文件呢?下面分享給大家一段PHP代碼:

<?php

//此文件用于快速測試UTF8編碼的文件是不是加了BOM,并可自動移除

$basedir="."; //修改此行為需要檢測的目錄,點表示當(dāng)前目錄
$auto=1; //是否自動移除發(fā)現(xiàn)的BOM信息。1為是,0為否。

//以下不用改動

if ($dh = opendir($basedir)) {
       while (($file = readdir($dh)) !== false) {
       if ($file!='.' && $file!='..' && !is_dir($basedir."/".$file)) echo "filename: $file ".checkBOM("$basedir/$file")." <br>";
       }
       closedir($dh);
}

function checkBOM ($filename) {
       global $auto;
       $contents=file_get_contents($filename);
       $charset[1]=substr($contents, 0, 1);
       $charset[2]=substr($contents, 1, 1);
       $charset[3]=substr($contents, 2, 1);
       if (ord($charset[1])==239 && ord($charset[2])==187 && ord($charset[3])==191) {
            if ($auto==1) {
                  $rest=substr($contents, 3);
                  rewrite ($filename, $rest);
                  return ("<font color=red>BOM found, automatically removed.</font>");
            } else {
                  return ("<font color=red>BOM found.</font>");
            }
        }
         else return ("BOM Not Found.");
}

function rewrite ($filename, $data) {
        $filenum=fopen($filename,"w");
        flock($filenum,LOCK_EX);
        fwrite($filenum,$data);
        fclose($filenum);
}
//結(jié)束
?>

 

關(guān)鍵詞:UTF-8BOMPHP

贊助商鏈接: