6 个由人工智能驱动的图像转文本工具
基于人工智能的工具可以根据文本描述生成照片和插图。但类似的工具可以做相反的事情:将图像转换为文本。
这是我最喜欢的六个。
可访问性和搜索引擎优化
图像到文本。人工智能对图像的理解是新的且不完善的。不过,这对我的经验很有帮助。
图像到文本提供由人工智能驱动的图像的简短描述。上传图像,该工具将对其进行描述。(但是,它对插图的帮助不大。)图像到文本提供免费和高级版本。
Gradio 的 InkyMM是另一个工具,它提供任何图像的免费详细描述。它提供两种型号:MPT 和 Dolly。后者在我的测试中产生了更好的结果,即使对于复杂的插图也是如此。
这两种工具都可以创建替代文本,这对于视觉障碍用户和搜索引擎优化至关重要。对于搜索引擎优化,请考虑使用目标关键字调整文本。
社交媒体标题
CaptionIt是一款免费增值手机应用程序,可为社交媒体创建字幕。上传照片并选择标题的样式。然后 CaptionIt 将根据这些设置和照片内容生成标题。该工具提高了我的工作效率并改进了我的字幕。
CaptionIt 的免费版本是有限的。(更)强大的 Pro 版本每月 1.99 美元。
从图像中提取文本
文本提取工具并不新鲜。许多辅助功能屏幕阅读器都包含它们。人工智能使这些工具更加准确——可访问性、搜索引擎优化、视频脚本等。该工具从图像、视频帧和演示幻灯片中提取文本。
Nanonet 的免费图像文本提取工具可以在几秒钟内处理最大 30 MB 的任何图像。输出是一个可下载的文本文件。该工具还可以提取手写文本,但在我的测试中结果不一致。Nanonets 还提供免费的 Google Chrome 扩展。
Google Lens是 Nanonets 的替代移动应用程序。它内置于iPhone 和 Android 的Google 搜索应用程序中。授予应用程序对照片的访问权限,选择图像,然后导航“文本”>“全选”>“复制文本”。
对于图像上过多的文本,请考虑提取然后将其粘贴到 ChatGPT 中以进行摘要。
图片到文字的翻译
谷歌翻译是一种流行的免费网络工具,可单独翻译文本或图像。
谷歌翻译将检测任何图像上的文本(键入或手写),并将该图像翻译成所选语言或单独作为文本。
Translate 与 Lens 一样,内置于 Google 的搜索应用中。