• <small id='0EHlx'></small><noframes id='0EHlx'>

    <legend id='0EHlx'><style id='0EHlx'><dir id='0EHlx'><q id='0EHlx'></q></dir></style></legend>
    1. <tfoot id='0EHlx'></tfoot>
      <i id='0EHlx'><tr id='0EHlx'><dt id='0EHlx'><q id='0EHlx'><span id='0EHlx'><b id='0EHlx'><form id='0EHlx'><ins id='0EHlx'></ins><ul id='0EHlx'></ul><sub id='0EHlx'></sub></form><legend id='0EHlx'></legend><bdo id='0EHlx'><pre id='0EHlx'><center id='0EHlx'></center></pre></bdo></b><th id='0EHlx'></th></span></q></dt></tr></i><div id='0EHlx'><tfoot id='0EHlx'></tfoot><dl id='0EHlx'><fieldset id='0EHlx'></fieldset></dl></div>

        <bdo id='0EHlx'></bdo><ul id='0EHlx'></ul>

        Python实现OCR识别之pytesseract案例详解

        时间:2023-12-17

            <bdo id='6halb'></bdo><ul id='6halb'></ul>
            <i id='6halb'><tr id='6halb'><dt id='6halb'><q id='6halb'><span id='6halb'><b id='6halb'><form id='6halb'><ins id='6halb'></ins><ul id='6halb'></ul><sub id='6halb'></sub></form><legend id='6halb'></legend><bdo id='6halb'><pre id='6halb'><center id='6halb'></center></pre></bdo></b><th id='6halb'></th></span></q></dt></tr></i><div id='6halb'><tfoot id='6halb'></tfoot><dl id='6halb'><fieldset id='6halb'></fieldset></dl></div>

            1. <small id='6halb'></small><noframes id='6halb'>

                <tbody id='6halb'></tbody>
              <legend id='6halb'><style id='6halb'><dir id='6halb'><q id='6halb'></q></dir></style></legend>
                <tfoot id='6halb'></tfoot>

                • Python实现OCR识别之pytesseract案例详解

                  介绍

                  在处理图像识别的过程中,主要需要完成以下的任务:

                  1. 去除图像中的背景噪音
                  2. 将图像转化为黑白图像
                  3. 图像分割
                  4. 字符识别

                  本文介绍了利用Python语言中的tesseract库来进行OCR识别的详细攻略。

                  安装

                  需要先安装tesseract库和pytesseract库。

                  1. 安装tesseract库
                  sudo apt-get install tesseract-ocr
                  sudo apt-get install libtesseract-dev
                  
                  1. 安装pytesseract库
                  pip3 install pytesseract
                  

                  示例1

                  在这个示例中,我们将使用一张包含文本的图片,并通过代码将其转换为文本。

                  try:
                      from PIL import Image
                  except ImportError:
                      import Image
                  import pytesseract
                  
                  # 打开图片
                  filename = 'sample.jpg'
                  image = Image.open(filename)
                  
                  # 识别文本,并存储在result变量中
                  result = pytesseract.image_to_string(image)
                  
                  # 打印输出结果
                  print(result)
                  

                  代码中首先导入了需要的库,然后打开了一个包含文本的图片。通过pytesseract库中的image_to_string函数,将图像中的文本转换为字符串。最终结果保存在result变量中,并通过打印输出展示出来。

                  示例2

                  在这个示例中,我们将使用pytesseract进行验证码识别。

                  try:
                      from PIL import Image
                  except ImportError:
                      import Image
                  import pytesseract
                  
                  # 打开图片,需要自己下载验证码图片
                  filename = 'code.png'
                  image = Image.open(filename)
                  
                  # 去除图像中的背景噪音
                  image = image.convert('L')
                  threshold = 200
                  table = []
                  for i in range(256):
                      if i < threshold:
                          table.append(0)
                      else:
                          table.append(1)
                  image = image.point(table, '1')
                  
                  # 分割图像
                  images = []
                  slices = [(5, 0, 13, 23), (19, 0, 27, 23), (33, 0, 41, 23), (47, 0, 55, 23)]
                  for slice in slices:
                      images.append(image.crop(slice))
                  
                  # 识别文本,并存储在result变量中
                  result = ''
                  for image in images:
                      result += pytesseract.image_to_string(image)
                  
                  # 打印输出结果
                  print(result)
                  

                  代码中首先导入了需要的库,然后打开了一个验证码图片。图像处理的过程中进行了去除背景噪音和图像分割的处理。最终通过pytesseract库中的image_to_string函数,将图像中的文本转换为字符串。最终结果保存在result变量中,并通过打印输出展示出来。

                  结论

                  通过本文,你可以了解如何使用Python中的pytesseract库来实现OCR识别的过程。其中包括了图片处理的过程和文本识别的细节。通过对本文示例代码的学习和实践,可以更好地掌握OCR识别的技能。

                  上一篇:python读取图片的方式,以及将图片以三维数组的形式输出方法 下一篇:Python读取视频的两种方法(imageio和cv2)

                  相关文章

                    • <bdo id='z9uI3'></bdo><ul id='z9uI3'></ul>

                  1. <small id='z9uI3'></small><noframes id='z9uI3'>

                    <tfoot id='z9uI3'></tfoot>
                  2. <i id='z9uI3'><tr id='z9uI3'><dt id='z9uI3'><q id='z9uI3'><span id='z9uI3'><b id='z9uI3'><form id='z9uI3'><ins id='z9uI3'></ins><ul id='z9uI3'></ul><sub id='z9uI3'></sub></form><legend id='z9uI3'></legend><bdo id='z9uI3'><pre id='z9uI3'><center id='z9uI3'></center></pre></bdo></b><th id='z9uI3'></th></span></q></dt></tr></i><div id='z9uI3'><tfoot id='z9uI3'></tfoot><dl id='z9uI3'><fieldset id='z9uI3'></fieldset></dl></div>
                      <legend id='z9uI3'><style id='z9uI3'><dir id='z9uI3'><q id='z9uI3'></q></dir></style></legend>