Python 2.7.x 和 3.x 版本的重要區(qū)別

2014-11-28 13:45:31來源:程序師作者:

許多Python初學(xué)者都會(huì)問:我應(yīng)該學(xué)習(xí)哪個(gè)版本的Python。對(duì)于這個(gè)問題,我的回答通常是“先選擇一個(gè)最適合你的Python教程,教程中使用哪個(gè)版本的Python,你就用那個(gè)版本。等學(xué)得差不多了,再來研究不同版本之間的差別”。

許多Python初學(xué)者都會(huì)問:我應(yīng)該學(xué)習(xí)哪個(gè)版本的Python。對(duì)于這個(gè)問題,我的回答通常是“先選擇一個(gè)最適合你的Python教程,教程中使用哪個(gè)版本的Python,你就用那個(gè)版本。等學(xué)得差不多了,再來研究不同版本之間的差別”。

但如果想要用Python開發(fā)一個(gè)新項(xiàng)目,那么該如何選擇Python版本呢?我可以負(fù)責(zé)任的說,大部分Python庫都同時(shí)支持Python 2.7.x和3.x版本的,所以不論選擇哪個(gè)版本都是可以的。但為了在使用Python時(shí)避開某些版本中一些常見的陷阱,或需要移植某個(gè)Python項(xiàng)目時(shí),依然有必要了解一下Python兩個(gè)常見版本之間的主要區(qū)別。

目錄

__future__模塊

[回到目錄]

Python 3.x引入了一些與Python 2不兼容的關(guān)鍵字和特性,在Python 2中,可以通過內(nèi)置的__future__模塊導(dǎo)入這些新內(nèi)容。如果你希望在Python 2環(huán)境下寫的代碼也可以在Python 3.x中運(yùn)行,那么建議使用__future__模塊。例如,如果希望在Python 2中擁有Python 3.x的整數(shù)除法行為,可以通過下面的語句導(dǎo)入相應(yīng)的模塊。

from __future__ import division

下表列出了__future__中其他可導(dǎo)入的特性:

特性 可選版本 強(qiáng)制版本 效果
nested_scopes 2.1.0b1 2.2 PEP 227:Statically Nested Scopes
generators 2.2.0a1 2.3 PEP 255:Simple Generators
division 2.2.0a2 3.0 PEP 238:Changing the Division Operator
absolute_import 2.5.0a1 3.0 PEP 328:Imports: Multi-Line and Absolute/Relative
with_statement 2.5.0a1 2.6 PEP 343:The “with” Statement
print_function 2.6.0a2 3.0 PEP 3105:Make print a function
unicode_literals 2.6.0a2 3.0 PEP 3112:Bytes literals in Python 3000

(來源: https://docs.python.org/2/library/future.html)

示例:

from platform import python_version

print函數(shù)

[回到目錄]

雖然print語法是Python 3中一個(gè)很小的改動(dòng),且應(yīng)該已經(jīng)廣為人知,但依然值得提一下:Python 2中的print語句被Python 3中的print()函數(shù)取代,這意味著在Python 3中必須用括號(hào)將需要輸出的對(duì)象括起來。

在Python 2中使用額外的括號(hào)也是可以的。但反過來在Python 3中想以Python2的形式不帶括號(hào)調(diào)用print函數(shù)時(shí),會(huì)觸發(fā)SyntaxError。

Python 2

print 'Python', python_version()
print 'Hello, World!'
print('Hello, World!')
print "text", ; print 'print more text on the same line'
Python 2.7.6
Hello, World!
Hello, World!
text print more text on the same line

Python 3

print('Python', python_version())
print('Hello, World!')

print("some text,", end="") 
print(' print more text on the same line')
Python 3.4.1
Hello, World!
some text, print more text on the same line
print 'Hello, World!'
File "<ipython-input-3-139a7c5835bd>", line 1
print 'Hello, World!'
^
SyntaxError: invalid syntax

注意:

在Python中,帶不帶括號(hào)輸出”Hello World”都很正常。但如果在圓括號(hào)中同時(shí)輸出多個(gè)對(duì)象時(shí),就會(huì)創(chuàng)建一個(gè)元組,這是因?yàn)樵赑ython 2中,print是一個(gè)語句,而不是函數(shù)調(diào)用。

print 'Python', python_version()
print('a', 'b')
print 'a', 'b'
Python 2.7.7
('a', 'b')
a b

整數(shù)除法

[回到目錄]

由于人們常常會(huì)忽視Python 3在整數(shù)除法上的改動(dòng)(寫錯(cuò)了也不會(huì)觸發(fā)Syntax Error),所以在移植代碼或在Python 2中執(zhí)行Python 3的代碼時(shí),需要特別注意這個(gè)改動(dòng)。

所以,我還是會(huì)在Python 3的腳本中嘗試用float(3)/2或 3/2.0代替3/2,以此來避免代碼在Python 2環(huán)境下可能導(dǎo)致的錯(cuò)誤(或與之相反,在Python 2腳本中用from __future__ import division來使用Python 3的除法)。

Python 2

print 'Python', python_version()
print '3 / 2 =', 3 / 2
print '3 // 2 =', 3 // 2
print '3 / 2.0 =', 3 / 2.0
print '3 // 2.0 =', 3 // 2.0
Python 2.7.6
3 / 2 = 1
3 // 2 = 1
3 / 2.0 = 1.5
3 // 2.0 = 1.0

Python 3

print('Python', python_version())
print('3 / 2 =', 3 / 2)
print('3 // 2 =', 3 // 2)
print('3 / 2.0 =', 3 / 2.0)
print('3 // 2.0 =', 3 // 2.0)
Python 3.4.1
3 / 2 = 1.5
3 // 2 = 1
3 / 2.0 = 1.5
3 // 2.0 = 1.0

Unicode

[回到目錄]

Python 2有基于ASCII的str()類型,其可通過單獨(dú)的unicode()函數(shù)轉(zhuǎn)成unicode類型,但沒有byte類型。

而在Python 3中,終于有了Unicode(utf-8)字符串,以及兩個(gè)字節(jié)類:bytes和bytearrays。

Python 2

print 'Python', python_version()
Python 2.7.6
print type(unicode('this is like a python3 str type'))
<type 'unicode'>
print type(b'byte type does not exist')
<type 'str'>
print 'they are really' + b' the same'
they are really the same
print type(bytearray(b'bytearray oddly does exist though'))
<type 'bytearray'>

Python 3

print('Python', python_version())
print('strings are now utf-8 u03BCnicou0394é!')
Python 3.4.1
strings are now utf-8 μnicoΔé!
print('Python', python_version(), end="")
print(' has', type(b' bytes for storing data'))
Python 3.4.1 has <class 'bytes'>
print('and Python', python_version(), end="")
print(' also has', type(bytearray(b'bytearrays')))
and Python 3.4.1 also has <class 'bytearray'>
'note that we cannot add a string' + b'bytes for data'
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-13-d3e8942ccf81> in <module>()
----> 1 'note that we cannot add a string' + b'bytes for data'

TypeError: Can't convert 'bytes' object to str implicitly

xrange

[回到目錄]

在Python 2.x中,經(jīng)常會(huì)用xrange()創(chuàng)建一個(gè)可迭代對(duì)象,通常出現(xiàn)在“for循環(huán)”或“列表/集合/字典推導(dǎo)式”中。

這種行為與生成器非常相似(如”惰性求值“),但這里的xrange-iterable無盡的,意味著可能在這個(gè)xrange上無限迭代。

由于xrange的“惰性求知“特性,如果只需迭代一次(如for循環(huán)中),range()通常比xrange()快一些。不過不建議在多次迭代中使用range(),因?yàn)閞ange()每次都會(huì)在內(nèi)存中重新生成一個(gè)列表。

在Python 3中,range()的實(shí)現(xiàn)方式與xrange()函數(shù)相同,所以就不存在專用的xrange()(在Python 3中使用xrange()會(huì)觸發(fā)NameError)。

import timeit

n = 10000
def test_range(n):
    return for i in range(n):
    pass

def test_xrange(n):
    for i in xrange(n):
    pass

Python 2

print 'Python', python_version()

print 'ntiming range()'
%timeit test_range(n)

print 'nntiming xrange()'
%timeit test_xrange(n)
Python 2.7.6

timing range()
1000 loops, best of 3: 433 µs per loop

timing xrange()
1000 loops, best of 3: 350 µs per loop

Python 3

print('Python', python_version())

print('ntiming range()')
%timeit test_range(n)
Python 3.4.1

timing range()
1000 loops, best of 3: 520 µs per loop
print(xrange(10))
---------------------------------------------------------------------------
NameError Traceback (most recent call last)
in ()
----> 1 print(xrange(10))

NameError: name 'xrange' is not defined

Python 3中的range對(duì)象中的__contains__方法

另一個(gè)值得一提的是,在Python 3.x中,range有了一個(gè)新的__contains__方法。__contains__方法可以有效的加快Python 3.x中整數(shù)和布爾型的“查找”速度。

x = 10000000
def val_in_range(x, val):
    return val in range(x)

def val_in_xrange(x, val):
    return val in xrange(x)

print('Python', python_version())
assert(val_in_range(x, x/2) == True)
assert(val_in_range(x, x//2) == True)
%timeit val_in_range(x, x/2)
%timeit val_in_range(x, x//2)
Python 3.4.1
1 loops, best of 3: 742 ms per loop
1000000 loops, best of 3: 1.19 µs per loop

根據(jù)上面的timeit的結(jié)果,查找整數(shù)比查找浮點(diǎn)數(shù)要快大約6萬倍。但由于Python 2.x中的range或xrange沒有__contains__方法,所以在Python 2中的整數(shù)和浮點(diǎn)數(shù)的查找速度差別不大。

print 'Python', python_version()

assert(val_in_xrange(x, x/2.0) == True)
assert(val_in_xrange(x, x/2) == True)
assert(val_in_range(x, x/2) == True)
assert(val_in_range(x, x//2) == True)
%timeit val_in_xrange(x, x/2.0)
%timeit val_in_xrange(x, x/2)
%timeit val_in_range(x, x/2.0)
%timeit val_in_range(x, x/2)
Python 2.7.7
1 loops, best of 3: 285 ms per loop
1 loops, best of 3: 179 ms per loop
1 loops, best of 3: 658 ms per loop
1 loops, best of 3: 556 ms per loop

下面的代碼證明了Python 2.x中沒有__contain__方法:

print('Python', python_version())
range.__contains__
Python 3.4.1
<slot wrapper '__contains__' of 'range' objects
print('Python', python_version())
range.__contains__
Python 2.7.7
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
<ipython-input-7-05327350dafb> in <module>()
1 print 'Python', python_version()
----> 2 range.__contains__

AttributeError: 'builtin_function_or_method' object has no attribute '__contains__'
print('Python', python_version())
xrange.__contains__
Python 2.7.7

---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
in ()
1 print 'Python', python_version()
----> 2 xrange.__contains__

AttributeError: type object 'xrange' has no attribute '__contains__'

關(guān)于Python 2中xrange()與Python 3中range()之間的速度差異的一點(diǎn)說明:

有讀者指出了Python 3中的range()和Python 2中xrange()執(zhí)行速度有差異。由于這兩者的實(shí)現(xiàn)方式相同,因此理論上執(zhí)行速度應(yīng)該也是相同的。這里的速度差別僅僅是因?yàn)镻ython 3的總體速度就比Python 2慢。

def test_while():
    i = 0
    while i < 20000:
        i += 1
    return
print('Python', python_version())
%timeit test_while()
Python 3.4.1
%timeit test_while()
100 loops, best of 3: 2.68 ms per loop
print 'Python', python_version()
%timeit test_while()
Python 2.7.6
1000 loops, best of 3: 1.72 ms per loop

觸發(fā)異常

[回到目錄]

Python 2支持新舊兩種異常觸發(fā)語法,而Python 3只接受帶括號(hào)的的語法(不然會(huì)觸發(fā)SyntaxError):

Python 2

print 'Python', python_version()
Python 2.7.6
raise IOError, "file error"
---------------------------------------------------------------------------
IOError Traceback (most recent call last)
<ipython-input-8-25f049caebb0> in <module>()
----> 1 raise IOError, "file error"

IOError: file error
raise IOError("file error")
---------------------------------------------------------------------------
IOError Traceback (most recent call last)
<ipython-input-9-6f1c43f525b2> in <module>()
----> 1 raise IOError("file error")

IOError: file error

Python 3

print('Python', python_version())
Python 3.4.1
raise IOError, "file error"
File "<ipython-input-10-25f049caebb0>", line 1
raise IOError, "file error"
^
SyntaxError: invalid syntax
The proper way to raise an exception in Python 3:
print('Python', python_version())
raise IOError("file error")
Python 3.4.1

---------------------------------------------------------------------------
OSError Traceback (most recent call last)
<ipython-input-11-c350544d15da> in <module>()
1 print('Python', python_version())
----> 2 raise IOError("file error")

OSError: file error

異常處理

[回到目錄]

Python 3中的異常處理也發(fā)生了一點(diǎn)變化。在Python 3中必須使用“as”關(guān)鍵字。

Python 2

print 'Python', python_version()
try:
    let_us_cause_a_NameError
except NameError, err:
    print err, '--> our error message'
Python 2.7.6
name 'let_us_cause_a_NameError' is not defined --> our error message

Python 3

print('Python', python_version())
try:
    let_us_cause_a_NameError
except NameError as err:
    print(err, '--> our error message')
Python 3.4.1
name 'let_us_cause_a_NameError' is not defined --> our error message

next()函數(shù)和.next()方法

[回到目錄]

由于會(huì)經(jīng)常用到next()(.next())函數(shù)(方法),所以還要提到另一個(gè)語法改動(dòng)(實(shí)現(xiàn)方面也做了改動(dòng)):在Python 2.7.5中,函數(shù)形式和方法形式都可以使用,而在Python 3中,只能使用next()函數(shù)(試圖調(diào)用.next()方法會(huì)觸發(fā)AttributeError)。

Python 2

print 'Python', python_version()
my_generator = (letter for letter in 'abcdefg')
next(my_generator)
my_generator.next()
Python 2.7.6
'b'

Python 3

print('Python', python_version())
my_generator = (letter for letter in 'abcdefg')
next(my_generator)
Python 3.4.1
'a'
my_generator.next()
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
<ipython-input-14-125f388bb61b> in <module>()
----> 1 my_generator.next()

AttributeError: 'generator' object has no attribute 'next'

For循環(huán)變量與全局命名空間泄漏

[回到目錄]

好消息是:在Python 3.x中,for循環(huán)中的變量不再會(huì)泄漏到全局命名空間中了!

這是Python 3.x中做的一個(gè)改動(dòng),在“What’s New In Python 3.0”中有如下描述:

“列表推導(dǎo)不再支持[… for var in item1, item2, …]這樣的語法,使用[… for var in (item1, item2, …)]代替。還要注意列表推導(dǎo)有不同的語義:現(xiàn)在列表推導(dǎo)更接近list()構(gòu)造器中的生成器表達(dá)式這樣的語法糖,特別要注意的是,循環(huán)控制變量不會(huì)再泄漏到循環(huán)周圍的空間中了。”

Python 2

print 'Python', python_version()

i = 1
print 'before: i =', i

print 'comprehension: ', [i for i in range(5)]

print 'after: i =', i
Python 2.7.6
before: i = 1
comprehension: [0, 1, 2, 3, 4]
after: i = 4

Python 3

print('Python', python_version())

i = 1
print('before: i =', i)

print('comprehension:', [i for i in range(5)])

print('after: i =', i)
Python 3.4.1
before: i = 1
comprehension: [0, 1, 2, 3, 4]
after: i = 1

比較無序類型

[回到目錄]

Python 3中另一個(gè)優(yōu)秀的改動(dòng)是,如果我們試圖比較無序類型,會(huì)觸發(fā)一個(gè)TypeError。

Python 2

print 'Python', python_version()
print "[1, 2] > 'foo' = ", [1, 2] > 'foo'
print "(1, 2) > 'foo' = ", (1, 2) > 'foo'
print "[1, 2] > (1, 2) = ", [1, 2] > (1, 2)
Python 2.7.6
[1, 2] > 'foo' = False
(1, 2) > 'foo' = True
[1, 2] > (1, 2) = False

Python 3

print('Python', python_version())
print("[1, 2] > 'foo' = ", [1, 2] > 'foo')
print("(1, 2) > 'foo' = ", (1, 2) > 'foo')
print("[1, 2] > (1, 2) = ", [1, 2] > (1, 2))
Python 3.4.1
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-16-a9031729f4a0> in <module>()
1 print('Python', python_version())
----> 2 print("[1, 2] > 'foo' = ", [1, 2] > 'foo')
3 print("(1, 2) > 'foo' = ", (1, 2) > 'foo')
4 print("[1, 2] > (1, 2) = ", [1, 2] > (1, 2))
TypeError: unorderable types: list() > str()

通過input()解析用戶的輸入

[回到目錄]

幸運(yùn)的是,Python 3改進(jìn)了input()函數(shù),這樣該函數(shù)就會(huì)總是將用戶的輸入存儲(chǔ)為str對(duì)象。在Python 2中,為了避免讀取非字符串類型會(huì)發(fā)生的一些危險(xiǎn)行為,不得不使用raw_input()代替input()。

Python 2

Python 2.7.6
[GCC 4.0.1 (Apple Inc. build 5493)] on darwin
Type "help", "copyright", "credits" or "license" for more information.

>>> my_input = input('enter a number: ')

enter a number: 123

>>> type(my_input)
<type 'int'>

>>> my_input = raw_input('enter a number: ')

enter a number: 123

>>> type(my_input)
<type 'str'>

Python 3

Python 3.4.1
[GCC 4.2.1 (Apple Inc. build 5577)] on darwin
Type "help", "copyright", "credits" or "license" for more information.

>>> my_input = input('enter a number: ')
enter a number: 123
>>> type(my_input)
<class 'str'>

返回可迭代對(duì)象,而不是列表

[回到目錄]

在xrange一節(jié)中可以看到,某些函數(shù)和方法在Python中返回的是可迭代對(duì)象,而不像在Python 2中返回列表。

由于通常對(duì)這些對(duì)象只遍歷一次,所以這種方式會(huì)節(jié)省很多內(nèi)存。然而,如果通過生成器來多次迭代這些對(duì)象,效率就不高了。

此時(shí)我們的確需要列表對(duì)象,可以通過list()函數(shù)簡單的將可迭代對(duì)象轉(zhuǎn)成列表。

Python 2

print 'Python', python_version()

print range(3)
print type(range(3))
Python 2.7.6
[0, 1, 2]
<type 'list'>

Python 3

print('Python', python_version())
print(range(3))
print(type(range(3)))
print(list(range(3)))
Python 3.4.1
range(0, 3)
<class 'range'>
[0, 1, 2]

下面列出了Python 3中其他不再返回列表的常用函數(shù)和方法:

  • zip()
  • map()
  • filter()
  • 字典的.key()方法
  • 字典的.value()方法
  • 字典的.item()方法
關(guān)鍵詞:Python