提取doc與pdf所用的方法都是一個,唯一區別是文件改后綴嗎?
看前兩節發現提取doc與pdf沒有啥區別,除了改后綴名的部分,這節主要程序判斷也是判斷后綴修改后綴,使用到指定的后綴,然后fnmatch判斷后綴,為何不直接用.分割文件名稱,判斷后綴是否是doc docx pdf,然后截取后綴+1文件名+.txt不就可以了,搞得那么復雜干什么?
看前兩節發現提取doc與pdf沒有啥區別,除了改后綴名的部分,這節主要程序判斷也是判斷后綴修改后綴,使用到指定的后綴,然后fnmatch判斷后綴,為何不直接用.分割文件名稱,判斷后綴是否是doc docx pdf,然后截取后綴+1文件名+.txt不就可以了,搞得那么復雜干什么?
2020-07-30
舉報
2020-12-14
是的,就是前兩節合成了這個