赞
踩
Python是目前编程领域最受欢迎的语言。在本文中,我将总结Python面试中最常见的50个问题。每道题都提供参考答案,希望能够帮助你在2019年求职面试中脱颖而出,找到一份高薪工作。这些面试题涉及Python基础知识、Python编程、数据分析以及Python函数库等多个方面。
Q1、Python中的列表和元组有什么区别?
Q2、Python的主要功能是什么?
Python是一种解释型语言。与C语言等语言不同,Python不需要在运行之前进行编译。
Python是动态语言,当您声明变量或类似变量时,您不需要声明变量的类型。
Python适合面向对象的编程,因为它允许类的定义以及组合和继承。Python没有访问说明(如C ++的public,private)。
在Python中,函数是第一类对象。它们可以分配给变量。类也是第一类对象
编写Python代码很快,但运行比较慢。Python允许基于C的扩展,例如numpy函数库。
Python可用于许多领域。Web应用程序开发,自动化,数学建模,大数据应用程序等等。它也经常被用作“胶水”代码。
Q3、Python是通用编程语言吗?
Python能够编写脚本,但从一般意义上讲,它被认为是一种通用编程语言。
Q4、Python是如何解释语言的?
Python在运行之前不需要对程序进行解释。因此,Python是一种解释型语言。
Q5、什么是pep?
PEP代表Python Enhancement Proposal。它是一组规则,指定如何格式化Python代码以获得最大可读性。
Q6、如何在Python中管理内存?
python中的内存管理由Python私有堆空间管理。所有Python对象和数据结构都位于私有堆中。程序员无权访问此私有堆。python解释器负责处理这个问题。
Python对象的堆空间分配由Python的内存管理器完成。核心API提供了一些程序员编写代码的工具。
Python还有一个内置的垃圾收集器,它可以回收所有未使用的内存,并使其可用于堆空间。
Q7、Python中的命名空间是什么?
命名空间是一个命名系统,用于确保名称是唯一性,以避免命名冲突。
Q8、什么是PYTHONPATH?
它是导入模块时使用的环境变量。每当导入模块时,也会查找PYTHONPATH以检查各个目录中是否存在导入的模块。解释器使用它来确定要加载的模块。
Q9、什么是python模块?Python中有哪些常用的内置模块?
Python模块是包含Python代码的.py文件。此代码可以是函数类或变量。一些常用的内置模块包括:sys、math、random、data time、JSON。
Q10、Python中的局部变量和全局变量是什么?
全局变量:在函数外或全局空间中声明的变量称为全局变量。这些变量可以由程序中的任何函数访问。
局部变量:在函数内声明的任何变量都称为局部变量。此变量存在于局部空间中,而不是全局空间中。
Q11、python是否区分大小写?
是。Python是一种区分大小写的语言。
Q12、什么是Python中的类型转换?
类型转换是指将一种数据类型转换为另一种数据类型。
int() - 将任何数据类型转换为整数类型
float() - 将任何数据类型转换为float类型
ord() - 将字符转换为整数
hex() – 将整数转换为十六进制
oct() - 将整数转换为八进制
tuple() - 此函数用于转换为元组。
set() - 此函数在转换为set后返回类型。
list() - 此函数用于将任何数据类型转换为列表类型。
dict() - 此函数用于将顺序元组(键,值)转换为字典。
str() - 用于将整数转换为字符串。
complex(real,imag) – 此函数将实数转换为复数(实数,图像)数。
Q13、如何在Windows上安装Python并设置路径变量?
要在Windows上安装Python,请按照以下步骤操作:
从以下链接安装python:https://http://www.python.org/downloads/
下载之后,将其安装在您的PC上。在命令提示符下使用以下命令查找PC上安装PYTHON的位置:cmd python。
然后转到高级系统设置并添加新变量并将其命名为PYTHON_NAME并粘贴复制的路径。
查找路径变量,选择其值并选择“编辑”。
如果值不存在,请在值的末尾添加分号,然后键入%PYTHON_HOME%
Q14、python中是否需要缩进?
缩进是Python必需的。它指定了一个代码块。循环,类,函数等中的所有代码都在缩进块中指定。通常使用四个空格字符来完成。如果您的代码没有必要缩进,它将无法准确执行并且也会抛出错误。
Q15、Python数组和列表有什么区别?
Python中的数组和列表具有相同的存储数据方式。但是,数组只能包含单个数据类型元素,而列表可以包含任何数据类型元素。
Q16、Python中的函数是什么?
函数是一个代码块,只有在被调用时才会执行。要在Python中定义函数,需要使用def关键字。
Q17、什么是__init__?
__init__是Python中的方法或者结构。在创建类的新对象/实例时,将自动调用此方法来分配内存。所有类都有__init__方法。
Q18、什么是lambda函数?
lambda函数也叫匿名函数,该函数可以包含任意数量的参数,但只能有一个执行操作的语句。
Q19、Python中的self是什么?
self是类的实例或对象。在Python中,self包含在第一个参数中。但是,Java中的情况并非如此,它是可选的。它有助于区分具有局部变量的类的方法和属性。init方法中的self变量引用新创建的对象,而在其他方法中,它引用其方法被调用的对象。
Q20、区分break,continue和pass?
Q21、[:: – 1}表示什么?
[:: – 1]用于反转数组或序列的顺序。
Q22、如何在Python中随机化列表中的元素?
可以使用shuffle函数进行随机列表元素。举例如下:
代码输出为:
Q23、什么是python迭代器?
迭代器是可以遍历或迭代的对象。
Q24、如何在Python中生成随机数?
random模块是用于生成随机数的标准模块。该方法定义为:
作者:千锋教育
链接:https://zhuanlan.zhihu.com/p/71913026
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
random.random()方法返回[0,1]范围内的浮点数。该函数生成随机浮点数。随机类使用的方法是隐藏实例的绑定方法。可以使用Random的实例来显示创建不同线程实例的多线程程序。其中使用的其他随机生成器是:
randrange(a,b):它选择一个整数并定义[a,b]之间的范围。它通过从指定范围中随机选择元素来返回元素。它不构建范围对象。
uniform(a,b):它选择一个在[a,b)范围内定义的浮点数
normalvariate(mean,sdev):它用于正态分布,其中mean是平均值,sdev是用于标准偏差的sigma。
使用和实例化的Random类创建一个独立的多个随机数生成器。
Q25、range&xrange有什么区别?
在大多数情况下,xrange和range在功能方面完全相同。它们都提供了一种生成整数列表的方法,唯一的区别是range返回一个Python列表对象,x range返回一个xrange对象。这就表示xrange实际上在运行时并不是生成静态列表。它使用称为yielding的特殊技术根据需要创建值。该技术与一种称为生成器的对象一起使用。因此如果你有一个非常巨大的列表,那么就要考虑xrange。
Q26、如何在python中写注释?
Python中的注释以#字符开头。也可以使用doc-strings(三重引号中包含的字符串)进行注释。
Q27、什么是pickling和unpickling?
Pickle模块接受任何Python对象并将其转换为字符串表示形式,并使用dump函数将其转储到文件中,此过程称为pickling。从存储的字符串中检索原始Python对象的过程称为unpickling。
Q28、python中的生成器是什么?
返回可迭代项集的函数称为生成器。
Q29、你如何把字符串的第一个字母大写?
在Python中,capitalize()函数可以将字符串的第一个字母大写。如果字符串在开头已经包含大写字母,那么它将返回原始字符串。
Q30、如何将字符串转换为全小写?
要将字符串转换为小写,可以使用lower()函数。
Q31、如何在python中注释多行?
注释多行代码时。所有要注释的行都要在开头前加#。还可以使用快捷方式来注释多行,就是按住Ctrl键并在每个想要包含#字符的地方左键单击并键入一次#。
Q32、什么是Python中的文档Docstrings?
Docstrings实际上不是注释,它们是文档字符串。这些文档字符串在三引号内。它们没有分配给任何变量,因此有时也用于注释。
Q33、operators中的is、not和in各有什么功能?
Operators是特殊函数,它们比较一个或多个值并产生相应的结果。其中is:当2个操作数为true时返回true(例如:“a”是’a’)
not:返回布尔值的倒数
in:检查某个元素是否存在于某个序列中
Q34、Python中help()和dir()函数的用法是什么?
Help()和dir()这两个函数都可以从Python解释器直接访问,并用于查看内置函数的合并转储。
help()函数:help()函数用于显示文档字符串,还可以查看与模块,关键字,属性等相关的使用信息。
dir()函数:dir()函数用于显示定义的符号。
Q35、当Python退出时,为什么不清除所有分配的内存?
当Python退出时,尤其是那些对其他对象具有循环引用的Python模块或者从全局名称空间引用的对象并没有被解除分配或释放。
无法解除分配C库保留的那些内存部分。
退出时,由于拥有自己的高效清理机制,Python会尝试取消分配/销毁其他所有对象。
Q36、Python中的字典是什么?
Python中的内置数据类型称为字典。它定义了键和值之间的一对一关系。字典包含一对键及其对应的值。字典由键索引。
Q37、如何在python中使用三元运算符?
三元运算符是用于显示条件语句的运算符。这包含true或false值,并且必须为其评估语句。其基本语法为:
三元运算符是用于显示条件语句的运算符。这包含true或false值,并且必须为其评估语句。其基本语法为:
[on_true] if [expression] else [on_false] x,y = 25,50big = x if x <y else y
Q38、为什么使用* args,* kwargs?*
当我们不确定将多少个参数传递给函数,或者我们想要将存储的列表或参数元组传递给函数时,我们使用* args。当我们不知道将多少关键字参数传递给函数时使用kwargs,或者它可以用于将字典的值作为关键字参数传递。标识符args和kwargs是一个约定,你也可以使用 bob和* billy。
Q39、len()函数有什么作用?
len()函数可用于确定字符串,列表,数组等的长度。
Q40、在Python中split(),sub(),subn()功能。
如果要修改字符串,Python的“re”模块提供了3种方法。他们是:
split() – 使用正则表达式模式将给定字符串“拆分”到列表中。
sub() – 查找正则表达式模式匹配的所有子字符串,然后用不同的字符串替换它们
subn() – 它类似于sub(),并且还返回新字符串。
Q41、什么是负指数,功能是什么?
Python中的序列是索引的,它由正数和负数组成。积极的数字使用’0’作为第一个索引,’1’作为第二个索引,进程继续使用。
负数的索引从’-1’开始,表示序列中的最后一个索引,’ – 2’作为倒数第二个索引,序列像正数一样前进。
负索引用于从字符串中删除任何换行符,并允许该字符串除了作为S [: – 1]给出的最后一个字符。负索引还用于显示索引以正确的顺序表示字符串。
Q42、什么是Python包?
Python包是包含多个模块的命名空间。
Q43、如何在Python中删除文件?
要在Python中删除文件,您需要导入OS模块。之后,您需要使用os.remove()函数。
Q44、什么是python的内置类型?
Python中的内置类型如下:整型、浮点型、复数、字符串、布尔等。
Q45、NumPy中有哪些操作Python列表的函数?
Python的列表是高效的通用容器。它们支持(相当)有效的插入,删除,追加和连接,Python的列表推导使它们易于构造和操作。
它们有一定的局限性:它们不支持像素化加法和乘法等“向量化”操作,并且它们可以包含不同类型的对象这一事实意味着Python必须存储每个元素的类型信息,并且必须执行类型调度代码在对每个元素进行操作时。
NumPy不仅效率更高; 它也更方便。你可以免费获得大量的向量和矩阵运算,这有时可以避免不必要的工作。它们也得到有效实施。
NumPy数组更快,你可以使用NumPy,FFT,卷积,快速搜索,基本统计,线性代数,直方图等内置。
Q46、如何将值添加到python数组?
可以使用append(),extend()和insert(i,x)函数将元素添加到数组中。
Q47、如何删除python数组的值?
可以使用pop()或remove()方法删除数组元素。这两个函数之间的区别在于前者返回已删除的值,而后者则不返回。
Q48、Python有OOps概念吗?
Python是一种面向对象的编程语言。这意味着可以通过创建对象模型在python中解决任何程序。同时Python可以被视为程序语言和结构语言。
Q49、深拷贝和浅拷贝有什么区别?
在创建新实例类型时使用浅拷贝,并保留在新实例中复制的值。浅拷贝用于复制引用指针,就像复制值一样。这些引用指向原始对象,并且在类的任何成员中所做的更改也将影响它的原始副本。浅拷贝允许更快地执行程序,它取决于所使用的数据的大小。
深拷贝用于存储已复制的值。深拷贝不会将引用指针复制到对象。它引用一个对象,并存储一些其他对象指向的新对象。原始副本中所做的更改不会影响使用该对象的任何其他副本。由于为每个被调用的对象创建了某些副本,因此深拷贝会使程序的执行速度变慢。
Q50、如何在Python中实现多线程?
Python有一个多线程库,但是用多线程来加速代码的效果并不是那么的好,
Python有一个名为Global Interpreter Lock(GIL)的结构。GIL确保每次只能执行一个“线程”。一个线程获取GIL执行相关操作,然后将GIL传递到下一个线程。
虽然看起来程序被多线程并行执行,但它们实际上只是轮流使用相同的CPU核心。
所有这些GIL传递都增加了执行的开销。这意味着多线程并不能让程序运行的更快。
这篇文章主要介绍了2019 Python最新面试题及答案16道题 ,非常不错,具有一定的参考借鉴价值,需要的朋友可以参考下
1.Python是如何进行内存管理的?
答:从三个方面来说,一对象的引用计数机制,二垃圾回收机制,三内存池机制
一、对象的引用计数机制
Python内部使用引用计数,来保持追踪内存中的对象,所有对象都有引用计数。
引用计数增加的情况:
1,一个对象分配一个新名称
2,将其放入一个容器中(如列表、元组或字典)
引用计数减少的情况:
1,使用del语句对对象别名显示的销毁
2,引用超出作用域或被重新赋值
sys.getrefcount( )函数可以获得对象的当前引用计数
多数情况下,引用计数比你猜测得要大得多。对于不可变数据(如数字和字符串),解释器会在程序的不同部分共享内存,以便节约内存。
二、垃圾回收
1,当一个对象的引用计数归零时,它将被垃圾收集机制处理掉。
2,当两个对象a和b相互引用时,del语句可以减少a和b的引用计数,并销毁用于引用底层对象的名称。然而由于每个对象都包含一个对其他对象的应用,因此引用计数不会归零,对象也不会销毁。(从而导致内存泄露)。为解决这一问题,解释器会定期执行一个循环检测器,搜索不可访问对象的循环并删除它们。
三、内存池机制
Python提供了对内存的垃圾收集机制,但是它将不用的内存放到内存池而不是返回给操作系统。
1,Pymalloc机制。为了加速Python的执行效率,Python引入了一个内存池机制,用于管理对小块内存的申请和释放。
2,Python中所有小于256个字节的对象都使用pymalloc实现的分配器,而大的对象则使用系统的malloc。
3,对于Python对象,如整数,浮点数和List,都有其独立的私有内存池,对象间不共享他们的内存池。也就是说如果你分配又释放了大量的整数,用于缓存这些整数的内存就不能再分配给浮点数。
2.什么是lambda函数?它有什么好处?
答:lambda 表达式,通常是在需要一个函数,但是又不想费神去命名一个函数的场合下使用,也就是指匿名函数
lambda函数:首要用途是指点短小的回调函数
lambda` `[arguments]:expression``>>> a``=``lambdax,y:x``+``y``>>> a(``3``,``11``)
3.Python里面如何实现tuple和list的转换?
答:直接使用tuple和list函数就行了,type()可以判断对象的类型
4.请写出一段Python代码实现删除一个list里面的重复元素
答:
1,使用set函数,set(list)
2,使用字典函数,
>>>a``=``[``1``,``2``,``4``,``2``,``4``,``5``,``6``,``5``,``7``,``8``,``9``,``0``]``>>> b``=``{}``>>>b``=``b.fromkeys(a)``>>>c``=``list``(b.keys())``>>> c
5.编程用sort进行排序,然后从最后一个元素开始判断
a``=``[``1``,``2``,``4``,``2``,``4``,``5``,``7``,``10``,``5``,``5``,``7``,``8``,``9``,``0``,``3``]``a.sort()``last``=``a[``-``1``]``for` `i inrange(``len``(a)``-``2``,``-``1``,``-``1``):``if` `last``=``=``a[i]:``del` `a[i]``else``:last``=``a[i]``print``(a)
6.Python里面如何拷贝一个对象?(赋值,浅拷贝,深拷贝的区别)
答:赋值(=),就是创建了对象的一个新的引用,修改其中任意一个变量都会影响到另一个。
浅拷贝:创建一个新的对象,但它包含的是对原始对象中包含项的引用(如果用引用的方式修改其中一个对象,另外一个也会修改改变){1,完全切片方法;2,工厂函数,如list();3,copy模块的copy()函数}
深拷贝:创建一个新的对象,并且递归的复制它所包含的对象(修改其中一个,另外一个不会改变){copy模块的deep.deepcopy()函数}
7.介绍一下except的用法和作用?
答:try…except…except…[else…][finally…]
执行try下的语句,如果引发异常,则执行过程会跳到except语句。对每个except分支顺序尝试执行,如果引发的异常与except中的异常组匹配,执行相应的语句。如果所有的except都不匹配,则异常会传递到下一个调用本代码的最高层try代码中。
try下的语句正常执行,则执行else块代码。如果发生异常,就不会执行
如果存在finally语句,最后总是会执行。
8.Python中pass语句的作用是什么?
答:pass语句不会执行任何操作,一般作为占位符或者创建占位程序,whileFalse:pass
9.介绍一下Python下range()函数的用法?
答:列出一组数据,经常用在for in range()循环中
10.如何用Python来进行查询和替换一个文本字符串?
答:可以使用re模块中的sub()函数或者subn()函数来进行查询和替换,
格式:sub(replacement, string[,count=0])(
replacement是被替换成的文本,string是需要被替换的文本,count是一个可选参数,指最大被替换的数量)
>>> ``import` `re``>>>p``=``re.``compile``(‘blue|white|red')``>>>``print``(p.sub(‘colour``','``blue socks ``and` `red shoes'))``colour socks ``and` `colourshoes``>>>``print``(p.sub(‘colour``','``blue socks ``and` `red shoes',count``=``1``))``colour socks ``and` `redshoes
subn()方法执行的效果跟sub()一样,不过它会返回一个二维数组,包括替换后的新的字符串和总共替换的数量
11.Python里面match()和search()的区别?
答:re模块中match(pattern,string[,flags]),检查string的开头是否与pattern匹配。
re模块中research(pattern,string[,flags]),在string搜索pattern的第一个匹配值。
>>>``print``(re.match(‘``super``', ‘superstition'``).span())``(``0``, ``5``)``>>>``print``(re.match(‘``super``', ‘insuperable'``))``None``>>>``print``(re.search(‘``super``', ‘superstition'``).span())``(``0``, ``5``)``>>>``print``(re.search(‘``super``', ‘insuperable'``).span())``(``2``, ``7``)
12.用Python匹配HTML tag的时候,<.*>和<.*?>有什么区别?
答:术语叫贪婪匹配( <.> )和非贪婪匹配(<.?> )
例如:
test
<.*> :
test
<.*?> :
13.Python里面如何生成随机数?
答:random模块
随机整数:random.randint(a,b):返回随机整数x,a<=x<=b
random.randrange(start,stop,[,step]):返回一个范围在(start,stop,step)之间的随机整数,不包括结束值。
随机实数:random.random( ):返回0到1之间的浮点数
random.uniform(a,b):返回指定范围内的浮点数。
14.有没有一个工具可以帮助查找python的bug和进行静态的代码分析?
答:PyChecker是一个python代码的静态分析工具,它可以帮助查找python代码的bug, 会对代码的复杂度和格式提出警告
Pylint是另外一个工具可以进行codingstandard检查
15.如何在一个function里面设置一个全局的变量?
答:解决方法是在function的开始插入一个global声明:
def f()
global x
16.单引号,双引号,三引号的区别
答:单引号和双引号是等效的,如果要换行,需要符号(),三引号则可以直接换行,并且可以包含注释
如果要表示Let’s go 这个字符串
单引号:s4 = ‘Let’s go’
双引号:s5 = “Let’s go”
s6 = ‘I realy like“python”!'
这就是单引号和双引号都可以表示字符串的原因了
总结
以上所述是小编给大家介绍的2019 Python最新面试题及答案16道题,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对脚本之家网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!
判断浮点数的运行结果是否相等:
a = 0.1 b = 0.2 c = 0.3 assert a + b == c
本题考查的是计算机的浮点运算知识点。不仅是 python 语言,其他的编程语言也面临同样的问题:在进行浮点运算的时候,10 进制表示方式会丢掉它的精度,造成运算结果与实际结果不符合。
这是由于底层 CPU 和运算标准通过自己的浮点单位去执行算术时的特征决定的。看似有穷的小数, 在计算机的二进制表示里却是无穷的。
所以在进行高进度浮点运算的时候一定要注意,尤其是自动化测试过程中需要进行断言非常容易出错。
断言失败,抛出 AssertionError 错误。
使用 Decimal 模块:
from decimal import Decimal a = 0.1 b = 0.2 c = 0.3 assert Decimal(str(a)) + Decimal(str(b)) == Decimal(str(c))
Decimal() 可以维持浮点数的精度,在金融领域和测试领域等精度要求高的行业有非常大的作用。 但是一定要注意: Decimal() 传的参数一定要是字符串类型,如果是数据类型会再次丢掉精度。
Decimal(0.1) + Decimal(0.2) == Decimal(0.3) # False Decimal('0.1') + Decimal('0.2') == Decimal('0.3') # True
有一个二维列表,降成普通的一维的。比如说柠檬班都会有学员分组,我们想通过分组信息去获取所有的学员名称。
groups = [['huahua', 'xiaojian'], ['musen', 'yuze'], ['keyou']] # 得到结果 ['huahua', 'xiaojian', 'musen', 'yuze', 'keyou']
最简单的方式可以通过 for 循环的方式一一提取:
names = [] for group in groups: for name in group: names.append(name) print(names)
但是在面试的时候可能会加一些限制,比如让你用一行代码实现,这个时候就需要对 python 基础有进一步的理解了,比如说使用 sum 函数:
names = sum(groups, [])
非常简单就实现了同样的功能。 sum 函数为什么可以做到呢?先看一个简单的例子:
a = sum([1,2,3])
得到的结果是 6, 也就是说, sum 函数会把一个列表里面的每个元素相加。但是 sum 函数还可以有第二个参数:开始值,默认为 0 , 所以上述过程其实可以写成:
a = sum([1,2,3], 0) # 0 + 1 + 2 + 3
依据同样的道理,可以对列表进行降维操作:
a = sum([['yuze'], ['is'], ['a']], [])
# [] + ['yuze'] + ['is'] + ['a']
# 列表拼接
通过列表推导式也可以方便的解决:
a = [e for group in groups for e in group]
class A:
def run(self):
print("a is running")
class B:
def run(self):
print("b is running")
class C(A, B):
pass
# 会打印什么???
C().run()
多重继承经常用来出面试题。在这个考题中,C 类的父类 A 和 B 都实现了 run 方法,那在 C 的对象里到底是优先调用哪一个呢?
答案是: a running
class A: def run(self): print("a running") class B(A): pass class C(A): def run(self): print("C running") class D(B, C): pass # 会打印什么??? D().run()
他们的继承关系图可以简化如下,这个问题又称为菱形问题或者钻石问题:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-hMhnClAk-1603255929159)()]
答案是: c running
如果我们不让 C 类继承 A 呢?
class A: def run(self): print("a running") class B(A): pass class C: def run(self): print("C running") class D(B, C): pass # 会打印什么??? D().run()
他们的继承关系图可以简化如下,可以简称为 v 型问题:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-OZbtHlGU-1603255929160)()]
答案会变成 a running
具体原因是 python 的继承会遵循特定的顺序,优先级排在前面的,子类会优先使用。怎么快速查看这种继承顺序呢?通过D.__mro__
去查看
比如在 菱形问题上,d 的顺序是这样的:
(<class '__main__.D'>, <class '__main__.B'>, <class '__main__.C'>, <class '__main__.A'>, <class 'object'>)
D 排在最前面,如果 D 定义了 run 方法,就会被优先使用,然后是 B, 然后是C, 然后是 A, 最后是 object 基类。
而在 V 行问题上,d 的顺序又变成了这样:
(<class '__main__.D'>, <class '__main__.B'>, <class '__main__.A'>, <class '__main__.C'>, <class 'object'>)
A 和 C 互换了顺序。造成 2 个题目的答案不一致。
\1. Python 面试问题及答案
作为一个 Python 新手,你必须熟悉基础知识。在本文中我们将讨论一些 Python 面试的基础问题和高级问题以及答案,以帮助你完成面试。包括 Python 开发问题、编程问题、数据结构问题、和 Python 脚本问题。让我们来深入研究这些问题
Python 面试问题
Q.1. Python 的特点和优点是什么?
Python 可以作为编程的入门语言,因为他具备以下特质:
\1. 解释性
\2. 动态特性
\3. 面向对象
\4. 语法简洁
\5. 开源
\6. 丰富的社区资源
实际上 Python 的优点远不止这些,更详细的介绍可以阅读 Introduction to Python( https://data-flair.training/blogs/python-tutorial/)
Q.2. 深拷贝和浅拷贝的区别是什么?
深拷贝是将对象本身复制给另一个对象。这意味着如果对对象的副本进行更改时不会影响原对象。在 Python 中,我们使用 deepcopy()函数进行深拷贝,使用方法如下:
深拷贝-Python 面试问题及答案
浅拷贝是将对象的引用复制给另一个对象。因此,如果我们在副本中进行更改,则会影响原对象。使用 copy()函数进行浅拷贝,使用方法如下:
浅拷贝—Python 面试问题及答案
Q.3. 列表和元祖有什么不同?
主要区别在于列表是可变的,元祖是不可变的。看下面的例子:
会出现以下错误提示:
TypeError: ‘tuple’ object does not support item assignment
关于列表和元祖的更多内容参考 Tuples vs Lists( https://data-flair.training/blogs/python-tuples-vs-lists/)
\2. Python 面试基础题
Q.4 到 Q.20 是新手经常会被问到的一些 Python 基础题,有经验的人也可以参考这些问题来复习这些概念。
Q.4. 解释 Python 中的三元表达式
与 C++不同, 在 Python 中我们不需要使用 ? 符号,而是使用如下语法:
[on true] if [expression]else [on false]
如果 [expression] 为真, 则 [on true] 部分被执行。如果表示为假则 [on false] 部分被执行
下面是例子:
2
Hi
Q.5. Python 中如何实现多线程?
线程是轻量级的进程,多线程允许一次执行多个线程。众所周知,Python 是一种多线程语言,它有一个多线程包。
GIL(全局解释器锁)确保一次执行单个线程。一个线程保存 GIL 并在将其传递给下一个线程之前执行一些操作,这就产生了并行执行的错觉。但实际上,只是线程轮流在 CPU 上。当然,所有传递都会增加执行的开销。
Q.6. 解释继承
一个类继承自另一个类,也可以说是一个孩子类/派生类/子类,继承自父类/基类/超类,同时获取所有的类成员(属性和方法)。
继承使我们可以重用代码,并且还可以更方便地创建和维护代码。Python 支持以下类型的继承:
\1. 单继承- 一个子类类继承自单个基类
\2. 多重继承- 一个子类继承自多个基类
\3. 多级继承- 一个子类继承自一个基类,而基类继承自另一个基类
\4. 分层继承- 多个子类继承自同一个基类
\5. 混合继承- 两种或两种以上继承类型的组合
关于继承的更多内容参考 Python Inheritance( https://data-flair.training/blogs/python-inheritance/)
Q.7. 什么是 Flask?
Flask 是一个使用 Python 编写的轻量级 Web 应用框架,使用 BSD 授权。其 WSGI 工具箱采用 Werkzeug,模板引擎则使用 Jinja2。除了 Werkzeug 和 Jinja2 以外几乎不依赖任何外部库。因为 Flask 被称为轻量级框架。
Flask 的会话会话使用签名 cookie 来允许用户查看和修改会话内容。它会记录从一个请求到另一个请求的信息。但如果要修改会话,则必须有密钥 Flask.secret_key。
我们将在后续的课程中进一步讨论 Flask。
Q.8. 如何在 Python 中管理内存?
Python 用一个私有堆内存空间来放置所有对象和数据结构,我们无法访问它。由解释器来管理它。不过使用一些核心 API,我们可以访问一些 Python 内存管理工具控制内存分配。
Q.9. 解释 Python 中的 help() 函数和 dir() 函数。
help() 函数返回帮助文档和参数说明:
运行结果如下:
Help on function copy in module copy
copy(x)
Shallow copy operation on arbitrary Python objects.
See the module』s doc string for more info.
dir() 函数返回对象中的所有成员 (任何类型)
Q.10. 当退出 Python 时是否释放所有内存分配?
答案是否定的。那些具有对象循环引用或者全局命名空间引用的变量,在 Python 退出是往往不会被释放
另外不会释放 C 库保留的部分内容。
Q.11. 什么是猴子补丁?
在运行时动态修改类和模块
Hi, monkey
Q.12. 什么是 Python 字典?
字典是我在 C++和 Java 中没有见过的数据结构,它拥有键-值对
3
字典是可变的,我们也可以用推导式的方式创建它.
{25: 5, 16: 4, 9: 3, 4: 2, 1: 1}
要了解更多字典的内容请点击 Python Dictionaries( https://data-flair.training/blogs/python-dictionaries/)
Q.13. 能否解释一下 *args 和 **kwargs?
如果我们不知道将多少个参数传递给函数,比如当我们想传递一个列表或一个元组值时,就可以使用*args。
3
2
1
4
7
当我们不知道将会传入多少关键字参数时,使用**kwargs 会收集关键字参数。
a.1
b.2
c.7
使用 args 和 kwargs 作为参数名只是举例,可以任意替换。
对于 Python 的基础题任何疑问,请在评论区提问。
Q.14. 编程实现计算文件中的大写字母数
26
Q.15. 什么是负索引?
我们先创建如下列表:
与正索引不同,负索引是从右边开始检索。
6
同样可以用于列表的切片:
[3, 4, 5, 6, 7]
Q.16. 如何随机打乱列表中元素,要求不引用额外的内存空间?
我们用 random 包中的 shuffle() 函数来实现。
[3, 4, 8, 0, 5, 7, 6, 2, 1]
Q.17. 解释 Python 中的 join() 和 split() 函数
join() 函数可以将指定的字符添加到字符串中。
‘1,2,3,4,5’
split() 函数可以用指定的字符分割字符串
[‘1’, ‘2’, ‘3’, ‘4’, ‘5’]
Q.18. Python 区分大小写吗?
验证 Python 是否区分大小写的方法是测试 myname 和 Myname 在程序中是不是算同一个标识符。观察以下代码的返回结果:
Myname
NameError: name ‘Myname’ is not defined
如你所见,这里出现了 NameError,所以 Python 是区分大小的语言。
Q.19. Python 中标识符的命名规则?
Python 中的标识符可以是任意长度,但必须遵循以下命名规则:
\1. 只能以下划线或者 A-Z/a-z 中的字母开头。
\2. 其余部分只能使用 A-Z/a-z/0-9。
\3. Python 标识符区分大小写。
\4. 关键字不能作为标识符。Python 有以下这些关键字:
Q.20. 如何删除字符串中的前置空格
前置空格是第一个非空格字符前的所有空格,使用 lstrip() 函数来删除.
‘Ayushi ‘
如图这个字符串既包含前置空格也包含后置空格. 调用 lstrip() 函数去除了前置空格。如果想去除后置空格,使用 rstrip() 函数。
‘ Ayushi’
以上是面向 Python 新手的基础题部分。
\3. Python 面试进阶题
Q. 21 至 Q. 35 是针对有经验者的一些 Python 面试问题及其答案和示例。
Q.21. 如何将字符串转换为小写?
使用 lower() 函数
‘ayushi’
转换为大写用 upper() 函数
‘AYUSHI’
要检查字符串是否为全大写或全小写,使用 isupper() 和 islower() 函数
像 @ 和$这样的字符即满足大写也满足小写。
istitle() 可以检查字符串是否是标题格式。
True
Q.22. Python 中的 pass 语句有什么作用?
我们在写代码时,有时可能只写了函数声明而没想好函数怎么写,但为了保证语法检查的正确必须输入一些东西。在这种情况下,我们使用 pass 语句。
类似的 break 语句可以跳出循环。
0
1
2
continue 语句可以跳到下一轮循环。
0
1
2
4
5
6
Q.23. 请解释 Python 中的闭包?
如果在一个内部函数里。对在外部作用域(但不是在全局作用域)的变量进行引用,那么内部函数就是一个闭包。
7
闭包的详细解释请点击 Closures in Python。(https://data-flair.training/blogs/python-closure/)
Q.24. 解释 Python 中的//,%和**运算符
//运算符执行地板除法,返回结果的整数部分 (向下取整)。
3
用/符号除法结果为 3.5。
符号表示取幂. ab 返回 a 的 b 次方
1024
% 是取模符号。返回除法后的余数。
6
0.5
对于 Python 进阶面试问题和答案有任何疑问请在评论区提问。
Q.24. Python 中有多少种运算符,解释算术运算符。
这类面试问题可以判断你的 Python 功底,可以举一些实例来回答这类问题。
在 Python 中我们有 7 中运算符:算术运算符、关系 (比较) 运算符、赋值运算符、逻辑运算符、位运算符、成员运算符、身份运算符。
\1. 加号 (+) 将两个对象的值相加。
15
\2. 减号 (-) 将第一个对象的值减去第二个对象的值。
-1
\3. 乘号 (*) 将两个对象的值相乘。
56
\4. 除号 (/) 将第一个对象的值除以第二个对象的值。
0.875
1.0
关于地板除法、取模和取幂,请参考上一个问题。
Q.25. 解释 Python 中的关系运算符。
关系运算符用来比较两个对象。
\1. 判断小于 (<):如果符号左边的值比右边小则返回 True。
False
\2. 判断大于 (>):如果符号左边的值比右边大则返回 True。
True
出现上面的错误结果是因为 Python 的浮点运算存在一些 Bug。
\3. 判断小于等于 (<=):如果符号左边的值小于或等于右边则返回 True。
True
\4. 大判断于等于 (>=):如果符号左边的值大于或等于右边则返回 True。
True
\5. 判断等于 (==) 如果符号两边的值相等则返回 True。
True
\6. 判断不等于 (!=) 如果符号两边的值不等则返回 True。
True
True
Q.26. 解释 Python 中的赋值和算数运算符?
这是面试中的常见题目。我们将算数运算符和赋值符号放在一起介绍。
Q.27. 解释 Python 中的逻辑运算符
Python 中有三个逻辑运算符:and、or、not
Q.28. 解释 Python 中的成员运算符
使用 in 和 not in 运算符我们可以判断某个值是否在成员中。
Q.29. 解释 Python 中的身份运算符
这是非常常见的 Python 面试题,用下面的示例来回答.
is 和 not is 运算符可以判断两个对象是否相同
Q.30. 解释 Python 中的位运算符
此运算符按二进制位对值进行操作。
\1. 与 (&) 返回按位与结果
2
\2. 或 (|) 返回按位或结果
3
\3. 异或 (^) 返回按位异或结果
1
\4. 取反 (~) 返回按位取反结果
-3
\5. 左移位 (<<) 将符号左边数的二进制左移右边数位
4
1 的二级制 001 左移 2 位变成 100 也即十进制的 4
\6. 右移位 (>>)
1
想了解关于位运算符的更多内容请点击 Operators in Python(https://data-flair.training/blogs/python-operators/)
Q.31. 如何在 Python 使用多进制数字?
除十进制以外,在 Python 中还可以使用二进制、八进制、十六进制。
\1. 二进制数有 0 和 1 组成,我们使用 0b 或 0B 前缀表示二进制数
10
使用 bin() 函数可以将数字转换为二进制
‘0b1111’
\2. 八进制数由数字 0-7 组成,使用前缀 0o 或 0O 表示 8 进制数
‘0o10’
\3. 十六进数由数字 0-15 组成,使用前缀 0x 或者 0X 表示 16 进制数
‘0x10’
‘0xf’
Q.32. 如何获取字典中的所有键?
使用 keys() 来获取字典中的所有键
Q.33. 问什么标识符不建议使用下划线开头?
因为在 Python 中以下划线开头的变量为私有变量,如果你不想让变量私有,就不要使用下划线开头。
Q.34. 如何声明多个变量并赋值?
有两种方式:
Q.35. 什么是元组的解封装?
首先我们来介绍元组封装:
(3, 4, 5)
将 3,4,5 封装到元组 mytuple 中。
现在我们要将这些值解封装到变量 x,y,z 中
12
以上是 Python 高级面试问题和答案,新手也可以参考这些问题以获得进阶的 Python 知识。
\4. 结束语
本篇文章介绍了一些重要的 Python 面试问题和答案,后续我们还会增加。在你面试之前应该熟练掌握这些。如有想添加的问题欢迎随时评论。
1、大数据的文件读取
① 利用生成器generator
②迭代器进行迭代遍历:for line in file
2、迭代器和生成器的区别
1)迭代器是一个更抽象的概念,任何对象,如果它的类有next方法和iter方法返回自己本身。对于string、list、dict、tuple等这类容器对象,使用for循环遍历是很方便的。在后台for语句对容器对象调用iter()函数,iter()是python的内置函数。iter()会返回一个定义了next()方法的迭代器对象,它在容器中逐个访问容器内元素,next()也是python的内置函数。在没有后续元素时,next()会抛出一个StopIteration异常
2)生成器(Generator)是创建迭代器的简单而强大的工具。它们写起来就像是正规的函数,只是在需要返回数据的时候使用yield语句。每次next()被调用时,生成器会返回它脱离的位置(它记忆语句最后一次执行的位置和所有的数据值)
区别:生成器能做到迭代器能做的所有事,而且因为自动创建了__iter__()和next()方法,生成器显得特别简洁,而且生成器也是高效的,使用生成器表达式取代列表解析可以同时节省内存。除了创建和保存程序状态的自动方法,当发生器终结时,还会自动抛出StopIteration异常
3、装饰器的作用和功能:
引入日志
函数执行时间统计
执行函数前预备处理
执行函数后的清理功能
权限校验等场景
缓存
4、简单谈下GIL:
Global Interpreter Lock(全局解释器锁)
Python代码的执行由Python 虚拟机(也叫解释器主循环,CPython版本)来控制,Python 在设计之初就考虑到要在解释器的主循环中,同时只有一个线程在执行,即在任意时刻,只有一个线程在解释器中运行。对Python 虚拟机的访问由全局解释器锁(GIL)来控制,正是这个锁能保证同一时刻只有一个线程在运行。
在多线程环境中,Python 虚拟机按以下方式执行:
\1. 设置GIL
\2. 切换到一个线程去运行
\3. 运行:
a. 指定数量的字节码指令,或者
b. 线程主动让出控制(可以调用time.sleep(0))
\4. 把线程设置为睡眠状态
\5. 解锁GIL
\6. 再次重复以上所有步骤
在调用外部代码(如C/C++扩展函数)的时候,GIL 将会被锁定,直到这个函数结束为止(由于在这期间没有Python 的字节码被运行,所以不会做线程切换)。
5、find和grep
grep命令是一种强大的文本搜索工具,grep搜索内容串可以是正则表达式,允许对文本文件进行模式查找。如果找到匹配模式,grep打印包含模式的所有行。
find通常用来再特定的目录下搜索符合条件的文件,也可以用来搜索特定用户属主的文件。
6、线上服务可能因为种种原因导致挂掉怎么办?
linux下的后台进程管理利器 supervisor
每次文件修改后再linux执行 service supervisord restart
7、如何提高python的运行效率
使用生成器;关键代码使用外部功能包(Cython,pylnlne,pypy,pyrex);针对循环的优化–尽量避免在循环中访问变量的属性
8、常用Linux命令:
ls,help,cd,more,clear,mkdir,pwd,rm,grep,find,mv,su,date
9、Python中的yield用法
yield简单说来就是一个生成器,这样函数它记住上次返 回时在函数体中的位置。对生成器第 二次(或n 次)调用跳转至该函 次)调用跳转至该函 数。
10、Python是如何进行内存管理的
一、垃圾回收:python不像C++,Java等语言一样,他们可以不用事先声明变量类型而直接对变量进行赋值。对Python语言来讲,对象的类型和内存都是在运行时确定的。这也是为什么我们称Python语言为动态类型的原因(这里我们把动态类型可以简单的归结为对变量内存地址的分配是在运行时自动判断变量类型并对变量进行赋值)。
二、引用计数:Python采用了类似Windows内核对象一样的方式来对内存进行管理。每一个对象,都维护这一个对指向该对对象的引用的计数。当变量被绑定在一个对象上的时候,该变量的引用计数就是1,(还有另外一些情况也会导致变量引用计数的增加),系统会自动维护这些标签,并定时扫描,当某标签的引用计数变为0的时候,该对就会被回收。
三、内存池机制Python的内存机制以金字塔行,-1,-2层主要有操作系统进行操作,
第0层是C中的malloc,free等内存分配和释放函数进行操作;
第1层和第2层是内存池,有Python的接口函数PyMem_Malloc函数实现,当对象小于256K时有该层直接分配内存;
第3层是最上层,也就是我们对Python对象的直接操作;
在 C 中如果频繁的调用 malloc 与 free 时,是会产生性能问题的.再加上频繁的分配与释放小块的内存会产生内存碎片. Python 在这里主要干的工作有:
如果请求分配的内存在1~256字节之间就使用自己的内存管理系统,否则直接使用 malloc.
这里还是会调用 malloc 分配内存,但每次会分配一块大小为256k的大块内存.
经由内存池登记的内存到最后还是会回收到内存池,并不会调用 C 的 free 释放掉.以便下次使用.对于简单的Python对象,例如数值、字符串,元组(tuple不允许被更改)采用的是复制的方式(深拷贝?),也就是说当将另一个变量B赋值给变量A时,虽然A和B的内存空间仍然相同,但当A的值发生变化时,会重新给A分配空间,A和B的地址变得不再相同
11、描述数组、链表、队列、堆栈的区别?
数组与链表是数据存储方式的概念,数组在连续的空间中存储数据,而链表可以在非连续的空间中存储数据;
队列和堆栈是描述数据存取方式的概念,队列是先进先出,而堆栈是后进先出;队列和堆栈可以用数组来实现,也可以用链表实现。
12、你知道几种排序,讲一讲你最熟悉的一种?
你是最棒的!
web框架部分
1.django 中当一个用户登录 A 应用服务器(进入登录状态),然后下次请求被 nginx 代理到 B 应用服务器会出现什么影响?
如果用户在A应用服务器登陆的session数据没有共享到B应用服务器,纳米之前的登录状态就没有了。
2.跨域请求问题django怎么解决的(原理)
启用中间件
post请求
验证码
表单中添加{%csrf_token%}标签
3.请解释或描述一下Django的架构
对于Django框架遵循MVC设计,并且有一个专有名词:MVT
M全拼为Model,与MVC中的M功能相同,负责数据处理,内嵌了ORM框架
V全拼为View,与MVC中的C功能相同,接收HttpRequest,业务处理,返回HttpResponse
T全拼为Template,与MVC中的V功能相同,负责封装构造要返回的html,内嵌了模板引擎
4.django对数据查询结果排序怎么做,降序怎么做,查询大于某个字段怎么做
排序使用order_by()
降序需要在排序字段名前加-
查询字段大于某个值:使用filter(字段名_gt=值)
5.说一下Django,MIDDLEWARES中间件的作用?
答:中间件是介于request与response处理之间的一道处理过程,相对比较轻量级,并且在全局上改变django的输入与输出。
6.你对Django的认识?
Django是走大而全的方向,它最出名的是其全自动化的管理后台:只需要使用起ORM,做简单的对象定义,它就能自动生成数据库结构、以及全功能的管理后台。
Django内置的ORM跟框架内的其他模块耦合程度高。
应用程序必须使用Django内置的ORM,否则就不能享受到框架内提供的种种基于其ORM的便利;理论上可以切换掉其ORM模块,但这就相当于要把装修完毕的房子拆除重新装修,倒不如一开始就去毛胚房做全新的装修。
Django的卖点是超高的开发效率,其性能扩展有限;采用Django的项目,在流量达到一定规模后,都需要对其进行重构,才能满足性能的要求。
Django适用的是中小型的网站,或者是作为大型网站快速实现产品雏形的工具。
Django模板的设计哲学是彻底的将代码、样式分离; Django从根本上杜绝在模板中进行编码、处理数据的可能。
\7. Django重定向你是如何实现的?用的什么状态码?
使用HttpResponseRedirect
redirect和reverse
状态码:302,301
8.ngnix的正向代理与反向代理?
正向代理 是一个位于客户端和原始服务器(origin server)之间的服务器,为了从原始服务器取得内容,客户端向代理发送一个请求并指定目标(原始服务器),然后代理向原始服务器转交请求并将获得的内容返回给客户端。客户端必须要进行一些特别的设置才能使用正向代理。
反向代理正好相反,对于客户端而言它就像是原始服务器,并且客户端不需要进行任何特别的设置。客户端向反向代理的命名空间中的内容发送普通请求,接着反向代理将判断向何处(原始服务器)转交请求,并将获得的内容返回给客户端,就像这些内容原本就是它自己的一样。
\9. Tornado 的核是什么?
Tornado 的核心是 ioloop 和 iostream 这两个模块,前者提供了一个高效的 I/O 事件循环,后者则封装了 一个无阻塞的 socket 。通过向 ioloop 中添加网络 I/O 事件,利用无阻塞的 socket ,再搭配相应的回调 函数,便可达到梦寐以求的高效异步执行。
10.Django 本身提供了 runserver,为什么不能用来部署?
runserver 方法是调试 Django 时经常用到的运行方式,它使用 Django 自带的
WSGI Server 运行,主要在测试和开发中使用,并且 runserver 开启的方式也是单进程 。
uWSGI 是一个 Web 服务器,它实现了 WSGI 协议、uwsgi、http 等协议。注意 uwsgi 是一种通信协议,而 uWSGI 是实现 uwsgi 协议和 WSGI 协议的 Web 服务器。uWSGI 具有超快的性能、低内存占用和多 app 管理等优点,并且搭配着 Nginx
就是一个生产环境了,能够将用户访问请求与应用 app 隔离开,实现真正的部署 。相比来讲,支持的并发量更高,方便管理多进程,发挥多核的优势,提升性能。
你是最棒的!
网络编程和前端部分
1.AJAX是什么,如何使用AJAX?
ajax(异步的javascript 和xml) 能够刷新局部网页数据而不是重新加载整个网页。
第一步,创建xmlhttprequest对象,var xmlhttp =new XMLHttpRequest();XMLHttpRequest对象用来和服务器交换数据。
第二步,使用xmlhttprequest对象的open()和send()方法发送资源请求给服务器。
第三步,使用xmlhttprequest对象的responseText或responseXML属性获得服务器的响应。
第四步,onreadystatechange函数,当发送请求到服务器,我们想要服务器响应执行一些功能就需要使用onreadystatechange函数,每次xmlhttprequest对象的readyState发生改变都会触发onreadystatechange函数。
\2. 常见的HTTP状态码有哪些?
200 OK
301 Moved Permanently
302 Found
304 Not Modified
307 Temporary Redirect
400 Bad Request
401 Unauthorized
403 Forbidden
404 Not Found
410 Gone
500 Internal Server Error
501 Not Implemented
\3. Post和get区别?
GET请求,请求的数据会附加在URL之后,以?分割URL和传输数据,多个参数用&连接。URL的编码格式采用的是ASCII编码,而不是uniclde,即是说所有的非ASCII字符都要编码之后再传输。
POST请求:POST请求会把请求的数据放置在HTTP请求包的包体中。上面的item=bandsaw就是实际的传输数据。
因此,GET请求的数据会暴露在地址栏中,而POST请求则不会。
2、传输数据的大小
在HTTP规范中,没有对URL的长度和传输的数据大小进行限制。但是在实际开发过程中,对于GET,特定的浏览器和服务器对URL的长度有限制。因此,在使用GET请求时,传输数据会受到URL长度的限制。
对于POST,由于不是URL传值,理论上是不会受限制的,但是实际上各个服务器会规定对POST提交数据大小进行限制,Apache、IIS都有各自的配置。
3、安全性
POST的安全性比GET的高。这里的安全是指真正的安全,而不同于上面GET提到的安全方法中的安全,上面提到的安全仅仅是不修改服务器的数据。比如,在进行登录操作,通过GET请求,用户名和密码都会暴露再URL上,因为登录页面有可能被浏览器缓存以及其他人查看浏览器的历史记录的原因,此时的用户名和密码就很容易被他人拿到了。除此之外,GET请求提交的数据还可能会造成Cross-site request frogery攻击。
4.cookie 和session 的区别?
1、cookie数据存放在客户的浏览器上,session数据放在服务器上。
2、cookie不是很安全,别人可以分析存放在本地的COOKIE并进行COOKIE欺骗考虑到安全应当使用session。
3、session会在一定时间内保存在服务器上。当访问增多,会比较占用服务器的性能考虑到减轻服务器性能方面,应当使用COOKIE。
4、单个cookie保存的数据不能超过4K,很多浏览器都限制一个站点最多保存20个cookie。
5、建议:
将登陆信息等重要信息存放为SESSION
其他信息如果需要保留,可以放在COOKIE中
5.创建一个简单tcp服务器需要的流程
1.socket创建一个套接字
2.bind绑定ip和port
3.listen使套接字变为可以被动链接
4.accept等待客户端的链接
5.recv/send接收发送数据
你是最棒的!
爬虫和数据库部分
1.scrapy和scrapy-redis有什么区别?为什么选择redis数据库?
scrapy是一个Python爬虫框架,爬取效率极高,具有高度定制性,但是不支持分布式。而scrapy-redis一套基于redis数据库、运行在scrapy框架之上的组件,可以让scrapy支持分布式策略,Slaver端共享Master端redis数据库里的item队列、请求队列和请求指纹集合。
为什么选择redis数据库,因为redis支持主从同步,而且数据都是缓存在内存中的,所以基于redis的分布式爬虫,对请求和数据的高频读取效率非常高。
\2. 你用过的爬虫框架或者模块有哪些?谈谈他们的区别或者优缺点?
Python自带:urllib,urllib2
第 三 方:requests
框 架:Scrapy
urllib和urllib2模块都做与请求URL相关的操作,但他们提供不同的功能。
urllib2.:urllib2.urlopen可以接受一个Request对象或者url,(在接受Request对象时候,并以此可以来设置一个URL 的headers),urllib.urlopen只接收一个url
urllib 有urlencode,urllib2没有,因此总是urllib,urllib2常会一起使用的原因
scrapy是封装起来的框架,他包含了下载器,解析器,日志及异常处理,基于多线程, twisted的方式处理,对于固定单个网站的爬取开发,有优势,但是对于多网站爬取 100个网站,并发及分布式处理方面,不够灵活,不便调整与括展。
request 是一个HTTP库, 它只是用来,进行请求,对于HTTP请求,他是一个强大的库,下载,解析全部自己处理,灵活性更高,高并发与分布式部署也非常灵活,对于功能可以更好实现.
Scrapy优缺点:
**优点:**scrapy 是异步的
采取可读性更强的xpath代替正则
强大的统计和log系统
同时在不同的url上爬行
支持shell方式,方便独立调试
写middleware,方便写一些统一的过滤器
通过管道的方式存入数据库
**缺点:**基于python的爬虫框架,扩展性比较差
基于twisted框架,运行中的exception是不会干掉reactor,并且异步框架出错后是不会停掉其他任务的,数据出错后难以察觉。
3.你常用的mysql引擎有哪些?各引擎间有什么区别?
主要 MyISAM 与 InnoDB 两个引擎,其主要区别如下:
一、InnoDB 支持事务,MyISAM 不支持,这一点是非常之重要。事务是一种高
级的处理方式,如在一些列增删改中只要哪个出错还可以回滚还原,而 MyISAM
就不可以了;
二、MyISAM 适合查询以及插入为主的应用,InnoDB 适合频繁修改以及涉及到
安全性较高的应用;
三、InnoDB 支持外键,MyISAM 不支持;
四、MyISAM 是默认引擎,InnoDB 需要指定;
五、InnoDB 不支持 FULLTEXT 类型的索引;
六、InnoDB 中不保存表的行数,如 select count(*) from table 时,InnoDB;需要
扫描一遍整个表来计算有多少行,但是 MyISAM 只要简单的读出保存好的行数即
可。注意的是,当 count(*)语句包含 where 条件时 MyISAM 也需要扫描整个表;
七、对于自增长的字段,InnoDB 中必须包含只有该字段的索引,但是在 MyISAM
表中可以和其他字段一起建立联合索引;
八、清空整个表时,InnoDB 是一行一行的删除,效率非常慢。MyISAM 则会重
建表;
九、InnoDB 支持行锁(某些情况下还是锁整表,如 update table set a=1 where
user like ‘%lee%’
4.描述下scrapy框架运行的机制?
从start_urls里获取第一批url并发送请求,请求由引擎交给调度器入请求队列,获取完毕后,调度器将请求队列里的请求交给下载器去获取请求对应的响应资源,并将响应交给自己编写的解析方法做提取处理:1. 如果提取出需要的数据,则交给管道文件处理;2. 如果提取出url,则继续执行之前的步骤(发送url请求,并由引擎将请求交给调度器入队列…),直到请求队列里没有请求,程序结束。
5.什么是关联查询,有哪些?
将多个表联合起来进行查询,主要有内连接、左连接、右连接、全连接(外连接)
6.写爬虫是用多进程好?还是多线程好? 为什么?
IO密集型代码(文件处理、网络爬虫等),多线程能够有效提升效率(单线程下有IO操作会进行IO等待,造成不必要的时间浪费,而开启多线程能在线程A等待时,自动切换到线程B,可以不浪费CPU的资源,从而能提升程序执行效率)。在实际的数据采集过程中,既考虑网速和响应的问题,也需要考虑自身机器的硬件情况,来设置多进程或多线程
7.数据库的优化?
\1. 优化索引、SQL 语句、分析慢查询;
\2. 设计表的时候严格根据数据库的设计范式来设计数据库;
\3. 使用缓存,把经常访问到的数据而且不需要经常变化的数据放在缓存中,能
节约磁盘IO;
\4. 优化硬件;采用SSD,使用磁盘队列技术(RAID0,RAID1,RDID5)等;
\5. 采用MySQL 内部自带的表分区技术,把数据分层不同的文件,能够提高磁
盘的读取效率;
\6. 垂直分表;把一些不经常读的数据放在一张表里,节约磁盘I/O;
\7. 主从分离读写;采用主从复制把数据库的读操作和写入操作分离开来;
\8. 分库分表分机器(数据量特别大),主要的的原理就是数据路由;
\9. 选择合适的表引擎,参数上的优化;
\10. 进行架构级别的缓存,静态化和分布式;
\11. 不采用全文索引;
\12. 采用更快的存储方式,例如 NoSQL存储经常访问的数据
8.常见的反爬虫和应对方法?
1).通过Headers反爬虫
从用户请求的Headers反爬虫是最常见的反爬虫策略。很多网站都会对Headers的User-Agent进行检测,还有一部分网站会对Referer进行检测(一些资源网站的防盗链就是检测Referer)。如果遇到了这类反爬虫机制,可以直接在爬虫中添加Headers,将浏览器的User-Agent复制到爬虫的Headers中;或者将Referer值修改为目标网站域名。对于检测Headers的反爬虫,在爬虫中修改或者添加Headers就能很好的绕过。
2).基于用户行为反爬虫
还有一部分网站是通过检测用户行为,例如同一IP短时间内多次访问同一页面,或者同一账户短时间内多次进行相同操作。
大多数网站都是前一种情况,对于这种情况,使用IP代理就可以解决。可以专门写一个爬虫,爬取网上公开的代理ip,检测后全部保存起来。这样的代理ip爬虫经常会用到,最好自己准备一个。有了大量代理ip后可以每请求几次更换一个ip,这在requests或者urllib2中很容易做到,这样就能很容易的绕过第一种反爬虫。
对于第二种情况,可以在每次请求后随机间隔几秒再进行下一次请求。有些有逻辑漏洞的网站,可以通过请求几次,退出登录,重新登录,继续请求来绕过同一账号短时间内不能多次进行相同请求的限制。
3).动态页面的反爬虫
上述的几种情况大多都是出现在静态页面,还有一部分网站,我们需要爬取的数据是通过ajax请求得到,或者通过JavaScript生成的。首先用Fiddler对网络请求进行分析。如果能够找到ajax请求,也能分析出具体的参数和响应的具体含义,我们就能采用上面的方法,直接利用requests或者urllib2模拟ajax请求,对响应的json进行分析得到需要的数据。
能够直接模拟ajax请求获取数据固然是极好的,但是有些网站把ajax请求的所有参数全部加密了。我们根本没办法构造自己所需要的数据的请求。这种情况下就用selenium+phantomJS,调用浏览器内核,并利用phantomJS执行js来模拟人为操作以及触发页面中的js脚本。从填写表单到点击按钮再到滚动页面,全部都可以模拟,不考虑具体的请求和响应过程,只是完完整整的把人浏览页面获取数据的过程模拟一遍。
用这套框架几乎能绕过大多数的反爬虫,因为它不是在伪装成浏览器来获取数据(上述的通过添加 Headers一定程度上就是为了伪装成浏览器),它本身就是浏览器,phantomJS就是一个没有界面的浏览器,只是操控这个浏览器的不是人。利selenium+phantomJS能干很多事情,例如识别点触式(12306)或者滑动式的验证码,对页面表单进行暴力破解等。
9.分布式爬虫主要解决什么问题?
1)ip
2)带宽
3)cpu
4)io
10.爬虫过程中验证码怎么处理?
1.scrapy自带
2.付费接口
1、一行代码实现1–100之和
利用sum()函数求和
2、如何在一个函数内部修改全局变量
函数内部global声明 修改全局变量
3、列出5个python标准库
os:提供了不少与操作系统相关联的函数
sys: 通常用于命令行参数
re: 正则匹配
math: 数学运算
datetime:处理日期时间
4、字典如何删除键和合并两个字典
del和update方法
5、谈下python的GIL
GIL 是python的全局解释器锁,同一进程中假如有多个线程运行,一个线程在运行python程序的时候会霸占python解释器(加了一把锁即GIL),使该进程内的其他线程无法运行,等该线程运行完后其他线程才能运行。如果线程运行过程中遇到耗时操作,则解释器锁解开,使其他线程运行。所以在多线程中,线程的运行仍是有先后顺序的,并不是同时进行。
多进程中因为每个进程都能被系统分配资源,相当于每个进程有了一个python解释器,所以多进程可以实现多个进程的同时运行,缺点是进程系统资源开销大
6、python实现列表去重的方法
先通过集合去重,在转列表
**7、fun(*args,*kwargs)中的*args,*kwargs什么意思?
8、python2和python3的range(100)的区别
python2返回列表,python3返回迭代器,节约内存.
9、一句话解释什么样的语言能够用装饰器?
函数可以作为参数传递的语言,可以使用装饰器。
10、python内建数据类型有哪些
整型–int
布尔型–bool
字符串–str
列表–list
元组–tuple
字典–dict
11、简述面向对象中__new__和__init__区别
__init__是初始化方法,创建对象后,就立刻被默认调用了,可接收参数,如图
1、__new__至少要有一个参数cls,代表当前类,此参数在实例化时由Python解释器自动识别。
2、__new__必须要有返回值,返回实例化出来的实例,这点在自己实现__new__时要特别注意,可以return父类(通过super(当前类名, cls))__new__出来的实例,或者直接是object的__new__出来的实例。
3、__init__有一个参数self,就是这个__new__返回的实例,__init__在__new__的基础上可以完成一些其它初始化的动作,__init__不需要返回值。
4、如果__new__创建的是当前类的实例,会自动调用__init__函数,通过return语句里面调用的__new__函数的第一个参数是cls来保证是当前类实例,如果是其他类的类名,;那么实际创建返回的就是其他类的实例,其实就不会调用当前类的__init__函数,也不会调用其他类的__init__函数。
12、简述with方法打开处理文件帮我我们做了什么?
打开文件在进行读写的时候可能会出现一些异常状况,如果按照常规的f.open写法,我们需要try,except,finally,做异常判断,并且文件最终不管遇到什么情况,都要执行finally f.close()关闭文件,with方法帮我们实现了finally中f.close(当然还有其他自定义功能,有兴趣可以研究with方法源码)。
13、列表[1,2,3,4,5],请使用map()函数输出[1,4,9,16,25],并使用列表推导式提取出大于10的数,最终输出[16,25]?
map()函数第一个参数是fun,第二个参数是一般是list,第三个参数可以写list,也可以不写,根据需求。
14、python中生成随机整数、随机小数、0–1之间小数方法
随机整数:random.randint(a,b),生成区间内的整数。
随机小数:习惯用numpy库,利用np.random.randn(5)生成5个随机小数。
0-1随机小数:random.random(),括号中不传参。
15、避免转义给字符串加哪个字母表示原始字符串?
r , 表示需要原始字符串,不转义特殊字符。
16、中国,用正则匹配出标签里面的内容(“中国”),其中class的类名是不确定的。
17、python中断言方法举例
assert()方法,断言成功,则程序继续执行,断言失败,则程序报错。
18、数据表student有id,name,score,city字段,其中name中的名字可有重复,需要消除重复行,请写sql语句
select distinct name from student
19、10个Linux常用命令
ls pwd cd touch rm mkdir tree cp mv cat more grep echo
20、python2和python3区别?列举5个
1、Python3 使用 print 必须要以小括号包裹打印内容,比如 print(‘hi’)
Python2 既可以使用带小括号的方式,也可以使用一个空格来分隔打印内容,比如 print ‘hi’
2、python2 range(1,10)返回列表,python3中返回迭代器,节约内存
3、python2中使用ascii编码,python中使用utf-8编码
4、python2中unicode表示字符串序列,str表示字节序列
python3中str表示字符串序列,byte表示字节序列
5、python2中为正常显示中文,引入coding声明,python3中不需要
6、python2中是raw_input()函数,python3中是input()函数
21、列出python中可变数据类型和不可变数据类型,并简述原理
不可变数据类型:数值型、字符串型string和元组tuple不允许变量的值发生变化,如果改变了变量的值,相当于是新建了一个对象,而对于相同的值的对象,在内存中则只有一个对象(一个地址),如下图用id()方法可以打印对象的id。
可变数据类型:列表list和字典dict;允许变量的值发生变化,即如果对变量进行append、+=等这种操作后,只是改变了变量的值,而不会新建一个对象,变量引用的对象的地址也不会变化,不过对于相同的值的不同对象,在内存中则会存在不同的对象,即每个对象都有自己的地址,相当于内存中对于同值的对象保存了多份,这里不存在引用计数,是实实在在的对象。
22、s = “ajldjlajfdljfddd”,去重并从小到大排序输出"adfjl"
set去重,去重转成list,利用sort方法排序,reeverse=False是从小到大排
list是不 变数据类型,s.sort时候没有返回值,所以注释的代码写法不正确。
23、用lambda函数实现两个数相乘
24、字典根据键从小到大排序
dic={“name”:“zs”,“age”:18,“city”:“深圳”,“tel”:“1362626627”}
25、利用collections库的Counter方法统计字符串每个单词出现的次数"kjalfj;ldsjafl;hdsllfdhg;lahfbl;hl;ahlf;h"
26、字符串a = “not 404 found 张三 99 深圳”,每个词中间是空格,用正则过滤掉英文和数字,最终输出"张三 深圳"
顺便贴上匹配小数的代码,虽然能匹配,但是健壮性有待进一步确认。
27、filter方法求出列表所有奇数并构造新列表,a = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
filter() 函数用于过滤序列,过滤掉不符合条件的元素,返回由符合条件元素组成的新列表。该接收两个参数,第一个为函数,第二个为序列,序列的每个元素作为参数传递给函数进行判,然后返回 True 或 False,最后将返回 True 的元素放到新列表。
28、列表推导式求列表所有奇数并构造新列表,a = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
29、正则re.complie作用
re.compile是将正则表达式编译成一个对象,加快速度,并重复使用。
30、a=(1,)b=(1),c=(“1”) 分别是什么类型的数据?
31、两个列表[1,5,7,9]和[2,2,6,8]合并为[1,2,2,3,6,7,8,9]
extend可以将另一个集合中的元素逐一添加到列表中,区别于append整体添加。
32、用python删除文件和用linux命令删除文件方法
python:os.remove(文件名)
linux: rm 文件名
33、log日志中,我们需要用时间戳记录error,warning等的发生时间,请用datetime模块打印当前时间戳 “2018-04-01 11:38:54”,顺便把星期的代码也贴上。
34、数据库优化查询方法
外键、索引、联合查询、选择特定字段等等
35、请列出你会的任意一种统计图(条形图、折线图等)绘制的开源库,第三方也行
pychart、matplotlib
36、写一段自定义异常代码
自定义异常用raise抛出异常。
37、正则表达式匹配中,(.*)和(.*?)匹配区别?
(.*)是贪婪匹配,会把满足正则的尽可能多的往后匹配
(.*?)是非贪婪匹配,会把满足正则的尽可能少匹配
38、简述Django的orm
ORM,全拼Object-Relation Mapping,意为对象-关系映射。实现了数据模型与数据库的解耦,通过简单的配置就可以轻松更换数据库,而不需要修改代码只需要面向对象编程,orm操作本质上会根据对接的数据库引擎,翻译成对应的sql语句,所有使用Django开发的项目无需关心程序底层使用的是MySQL、Oracle、sqlite…,如果数据库迁移,只需要更换Django的数据库引擎即可。
39、[[1,2],[3,4],[5,6]]一行代码展开该列表,得出[1,2,3,4,5,6]
列表推导式的骚操作
运行过程:for i in a ,每个i是【1,2】,【3,4】,【5,6】,for j in i,每个j就是1,2,3,4,5,6,合并后就是结果。
还有更骚的方法,将列表转成numpy矩阵,通过numpy的flatten()方法,代码永远是只有更骚,没有最骚
40、x=“abc”,y=“def”,z=[“d”,“e”,“f”],分别求出x.join(y)和x.join(z)返回的结果
join()括号里面的是可迭代对象,x插入可迭代对象中间,形成字符串,结果一致,有没有突然感觉字符串的常见操作都不会玩了
顺便建议大家学下os.path.join()方法,拼接路径经常用到,也用到了join,和字符串操作中的join有什么区别,该问题大家可以查阅相关文档。
41、举例说明异常模块中try except else finally的相关意义
try…except…else没有捕获到异常,执行else语句。
try…except…finally不管是否捕获到异常,都执行finally语句。
42、python中交换两个数值
43、举例说明zip()函数用法
zip()函数在运算时,会以一个或多个序列(可迭代对象)做为参数,返回一个元组的列表。同时将这些序列中并排的元素配对。
zip()参数可以接受任何类型的序列,同时也可以有两个以上的参数;当传入参数的长度不同时,zip能自动以最短序列长度为准进行截取,获得元组。
44、a=“张明 98分”,用re.sub,将98替换为100
45、写5条常用sql语句
show databases;
show tables;
desc 表名;
select * from 表名;
delete from 表名 where id=5;
update students set gender=0,hometown=“北京” where id=5
46、a="hello"和b="你好"编码成bytes类型
47、[1,2,3]+[4,5,6]的结果是多少?
两个列表相加,等价于extend。
48、提高python运行效率的方法
1、使用生成器,因为可以节约大量内存
2、循环代码优化,避免过多重复代码的执行
3、核心模块用Cython PyPy等,提高效率
4、多进程、多线程、协程
5、多个if elif条件判断,可以把最有可能先发生的条件放到前面写,这样可以减少程序判断的次数,提高效率
49、简述mysql和redis区别
redis: 内存型非关系数据库,数据保存在内存中,速度快
mysql:关系型数据库,数据保存在磁盘中,检索的话,会有一定的Io操作,访问速度相对慢
50、遇到bug如何处理
1、细节上的错误,通过print()打印,能执行到print()说明一般上面的代码没有问题,分段检测程序是否有问题,如果是js的话可以alert或console.log。
2、如果涉及一些第三方框架,会去查官方文档或者一些技术博客。
3、对于bug的管理与归类总结,一般测试将测试出的bug用teambin等bug管理工具进行记录,然后我们会一条一条进行修改,修改的过程也是理解业务逻辑和提高自己编程逻辑缜密性的方法,我也都会收藏做一些笔记记录。
4、导包问题、城市定位多音字造成的显示错误问题。
51、正则匹配,匹配日期2018-03-20
url=‘https://sycm.taobao.com/bda/tradinganaly/overview/get_summary.json?dateRange=2018-03-20%7C2018-03-20&dateType=recent1&device=1&token=ff25b109b&_=1521595613462’
仍有同学问正则,其实匹配并不难,提取一段特征语句,用(.*?)匹配即可。
52、list=[2,3,5,4,9,6],从小到大排序,不许用sort,输出[2,3,4,5,6,9]
利用min()方法求出最小值,原列表删除最小值,新列表加入最小值,递归调用获取最小值的函数,反复操作。
53、写一个单列模式
因为创建对象时__new__方法执行,并且必须return 返回实例化出来的对象所cls.__instance是否存在,不存在的话就创建对象,存在的话就返回该对象,来保证只有一个实例对象存在(单列),打印ID,值一样,说明对象同一个。
54、保留两位小数
题目本身只有a="%.03f"%1.3335,让计算a的结果,为了扩充保留小数的思路,提供round方法(数值,保留位数)。
55、求三个方法打印结果
fn(“one”,1)直接将键值对传给字典;
fn(“two”,2)因为字典在内存中是可变数据类型,所以指向同一个地址,传了新的额参数后,会相当于给字典增加键值对;
fn(“three”,3,{})因为传了一个新字典,所以不再是原先默认参数的字典。
来源网络,侵权删除返回搜狐,查看更多
[](javascript:void(0)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。