查看原文
其他

从零开始用 Gemini 和 Claude 打造多功能图片识别应用 | 完整操作+完整代码

思辨view kate人不错
2024-07-24

项目背景

在浏览Google Gemini Cookbook时,我发现一个Jupyter notebook示例。整个notebook演示了如何使用Gemini 1.5 Flash模型处理不同的场景,包括文本处理、聊天处理和多模态处理。它展示了从安装SDK到发送请求和处理响应的全过程,帮助开发者理解如何集成和使用Gemini模型进行各类生成式AI任务。

https://github.com/google-gemini/cookbook/blob/main/quickstarts/Gemini_Flash_Introduction.ipynb

这激发了我创建一个基于Gemini的图片识别应用,以满足我的复杂需求。

我将在最后提供这个项目的完整代码。

这个项目使用了Gemini API Key,可以申请一个免费的Gemini API Key。API Key 获取链接:https://aistudio.google.com/app/apikey?hl=zh-cn。

Gemini 的图片识别应用效果预览

初始界面:

修改3版后界面:

继续滑动看下一个
kate人不错
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存