描述: restaurant menu card
描述:cheesecake store
描述:Advertisement of limited offer in McDonald's
1
czfy 287 天前 1
“需要用几个简单的词描述一下图片里的内容”
举个例子,最后要描述成什么样 |
2
h272377502 287 天前 1
gpt4 不是提供了 api 了吗,minigpt4 和 gpt4 差距很大
|
4
Egfly OP @h272377502 gpt4 api 有调用频率限制吗
|
5
dobelee 287 天前 1
看你的例子可不“简单”。图二需要通过 cake 等字眼结合分析才能得到是餐厅,图三需要识别麦当劳的 logo 才能得出是麦当劳的广告。一般给照片内容识别打标签的 AI 没训练到这程度吧,还是得上 chatgpt 或者 gemini 。
|
7
jZEdn7k4 287 天前 via iPhone 2
你这个任务叫 image captioning ,github 用这个关键词搜一下,不少开源代码和模型的,当然质量比不上 gpt 也不会太差
|
8
Puteulanus 287 天前 1
我之前用过 IBM Watson Visual Recognition ,不知道现在还活着没
国内的用过腾讯的万象优图 https://cloud.tencent.com/document/product/460/39082 |
9
loi1noG2463cVpXu 287 天前 via Android 1
人工,增加工作机会,造福社会
|
10
vivisidea 287 天前 1
|