资源简介

翻译于经典图像理解综述文章。”从图像生成自然语言描述是计算机视觉,自然语言处理和人工智能(AI)交叉处的一个新兴的跨学科问题。 这项任务通常被称为图像或视觉字幕/描述(captioning),它构成了许多重要应用的技术基础,如语义视觉搜索,聊天机器人的视觉智能,社交媒体中的照片和视频分享以及帮助视障人士感知周围环境视觉内容。由于最近深度学习的发展,人工智能研究界近年来在可视字幕方面取得了巨大的进步。”

资源截图

代码片段和文件信息

评论

共有 条评论