用python搭建百萬答題、自動百度搜尋答案。
使用平臺
windows7
python3.6
MIX2手機
程式碼原理
手機螢幕內容同步到pc端
對問題截圖
對截圖文字分析
用瀏覽器自動搜尋文字
使用教程
1、使用Airdroid 將手機螢幕顯示在電腦螢幕上。
也可使用360手機助手實現。不涉及任何程式碼。實現效果如圖:
2、在提問出現時,執行python程式,將問題部分截圖。
這裡要用到兩個函式:
get_point() #採集要截圖的座標,以及圖片的高度寬度
window_capture() #截圖
def get_point(): '''採集座標,並返回w,h,x,y。 作為window_capture() 函式使用''' try: print('正在採集座標1,請將滑鼠移動到該點') # print(3) # time.sleep(1) print(2) time.sleep(1) print(1) time.sleep(1) x1,y1 = pag.position() #返回滑鼠的座標 print('採整合功,座標為:',(x1,y1)) print('') # time.sleep(2) print('正在採集座標2,請將滑鼠移動到該點') print(3) time.sleep(1) print(2) time.sleep(1) print(1) time.sleep(1) x2, y2 = pag.position() # 返回滑鼠的座標 print('採整合功,座標為:',(x2,y2)) #os.system('cls')#清除螢幕 w = abs(x1 - x2) h = abs(y1 - y2) x = min(x1, x2) y = min(y1, y2) return (w,h,x,y) except KeyboardInterrupt: print('獲取失敗')
def window_capture(result,filename): '''獲取截圖''' #寬度w #高度h #左上角截圖的座標x,y w,h,x,y=result hwnd = 0 hwndDC = win32gui.GetWindowDC(hwnd) mfcDC = win32ui.CreateDCFromHandle(hwndDC) saveDC = mfcDC.CreateCompatibleDC() saveBitMap = win32ui.CreateBitmap() MoniterDev = win32api.EnumDisplayMonitors(None,None) #w = MoniterDev[0][2][2] # #h = MoniterDev[0][2][3] # w = 516 # h = 514 saveBitMap.CreateCompatibleBitmap(mfcDC,w,h) saveDC.SelectObject(saveBitMap) saveDC.BitBlt((0,0),(w,h),mfcDC,(x,y),win32con.SRCCOPY) saveBitMap.SaveBitmapFile(saveDC,filename)
執行後截圖如下
3.對圖片文字分析提取
參考連結: * 圖片轉文字 * 配置方式
程式碼部分:
def orc_pic(): #識別中文 text=pytesseract.image_to_string(Image.open('jietu.jpg'),lang='chi_sim') #識別英文 # text=pytesseract.image_to_string(Image.open('jietu.jpg')) text = ''.join(text.split()) return text
4.對文字進行搜尋
#瀏覽器搜尋 url = 'http://www.baidu.com/s?wd=%s' % text webbrowser.open(url)
所有程式碼如下:
#coding:'utf-8' import win32gui, win32ui, win32con, win32api from PIL import Image import pytesseract import webbrowser #先下載pyautogui庫,pip install pyautogui import os,time import pyautogui as pag #獲取sdk http://ai.baidu.com/。 #獲取aip pip install git+https://github.com/Baidu-AIP/python-sdk.git@master from aip import AipOcr import json status=0 """ 你的 APPID AK SK """ APP_ID = '****' API_KEY = '***' SECRET_KEY = '***' client = AipOcr(APP_ID, API_KEY, SECRET_KEY) """ 讀取圖片 """ def get_question(path): '''百度識別圖片文字''' with open(path, 'rb') as fp: image=fp.read() res = client.basicGeneral(image) words = res['words_result'] lines = [item['words'] for item in words] question = ''.join(lines) if question[1] == '.': question = question[2:] elif question[2] == '.': question = question[3:] return question.replace('?', ' ') #採集座標 def get_point(): '''採集座標,並返回w,h,x,y。 作為window_capture() 函式使用''' try: print('正在採集座標1,請將滑鼠移動到該點') # print(3) # time.sleep(1) print(2) time.sleep(1) print(1) time.sleep(1) x1,y1 = pag.position() #返回滑鼠的座標 print('採整合功,座標為:',(x1,y1)) print('') # time.sleep(2) print('正在採集座標2,請將滑鼠移動到該點') print(3) time.sleep(1) print(2) time.sleep(1) print(1) time.sleep(1) x2, y2 = pag.position() # 返回滑鼠的座標 print('採整合功,座標為:',(x2,y2)) #os.system('cls')#清除螢幕 w = abs(x1 - x2) h = abs(y1 - y2) x = min(x1, x2) y = min(y1, y2) return (w,h,x,y) except KeyboardInterrupt: print('獲取失敗') #獲取截圖 def window_capture(result,filename): '''獲取截圖''' #寬度w #高度h #左上角截圖的座標x,y w,h,x,y=result hwnd = 0 hwndDC = win32gui.GetWindowDC(hwnd) mfcDC = win32ui.CreateDCFromHandle(hwndDC) saveDC = mfcDC.CreateCompatibleDC() saveBitMap = win32ui.CreateBitmap() MoniterDev = win32api.EnumDisplayMonitors(None,None) #w = MoniterDev[0][2][2] # #h = MoniterDev[0][2][3] # w = 516 # h = 514 saveBitMap.CreateCompatibleBitmap(mfcDC,w,h) saveDC.SelectObject(saveBitMap) saveDC.BitBlt((0,0),(w,h),mfcDC,(x,y),win32con.SRCCOPY) saveBitMap.SaveBitmapFile(saveDC,filename) def get_point_txt(status): #如果status=y,則重新獲取座標 '''如果存在point.txt,則詢問是否重新採集,刪除point.txt;如果不存在txt,則直接採集。''' if not os.path.isfile('point.txt') : result = get_point() with open('point.txt', 'w') as f: f.write(str(result)) return result else: if status=='y': result = get_point() with open('point.txt', 'w') as f: f.write(str(result)) return result else: with open('point.txt', 'r') as f: result = f.readline() result = eval(result) return result def orc_pic(): #識別中文 text=pytesseract.image_to_string(Image.open('jietu.jpg'),lang='chi_sim') #識別英文 # text=pytesseract.image_to_string(Image.open('jietu.jpg')) text = ''.join(text.split()) return text #百度識別 def orc_baidu(): text=get_question('jietu.jpg') return text status='y' start = time.time() result=get_point_txt(status) for i in range(10): window_capture(result,'jietu.jpg') # text=orc_baidu() text=orc_pic() print(text) #瀏覽器搜尋 url = 'http://www.baidu.com/s?wd=%s' % text webbrowser.open(url) # url2='https://www.google.com/search?q=%s' % text # webbrowser.open(url2) end = time.time() time=end-start print('此次耗時%.1f秒' % time)