如何在手机上使用 Google Gemini

CometAPI
AnnaJul 2, 2025
如何在手机上使用 Google Gemini

Google Gemini 标志着移动 AI 的新时代,在 Android 和 iOS 环境中深度集成,提供强大的对话能力。无论是免手动发送信息、管理日程,还是通过自然语言整理照片,Gemini 都致力于成为你处理日常任务的首选助手。本综合指南涵盖从初始设置到高级功能使用的全部内容,提供清晰步骤、实用示例以及隐私注意事项。

什么是 Google Gemini?

Gemini 与 Google Assistant 有何不同?

Google Gemini 代表了 Google AI 助手的下一代产品,依托 Gemini 2.5 模型系列,提供比前代更丰富、更加具备上下文感知的交互。在 Google I/O 2025 上,Google 展示了诸如 Deep Think(面向复杂问题求解的实验性推理模式)和更自然的对话体验的原生音频输出等增强功能。这些升级使 Gemini 能以更高的准确性和流畅度处理复杂任务——例如分步编码协助或深入研究查询——比旧版 Assistant 更胜一筹。

Gemini 2.5 的关键改进是什么?

Gemini 2.5 引入了多项核心增强:

  • 高级推理模式(“Deep Think”),用于应对复杂的数学与编码挑战。
  • Project Mariner 能力,使 AI 能与设备功能交互(例如发送信息、打开应用)。
  • 增强的安全防护,在保障用户数据的同时保持流畅的 AI 性能。
  • LearnLM 集成,面向教育场景,Gemini for Education 在多个国家为学生和教师提供个性化测验与学习辅助。

总体而言,这些增强使 Gemini 不仅是对话伙伴,更是生产力、创意和学习的多功能工具。

如何在手机上使用 Gemini?

哪些设备支持 Google Gemini?

Google Gemini 首先在运行 Android 10 或更高版本且至少 2 GB RAM 的现代 Android 设备上推出;它也可通过 iOS 上的 Google 应用访问。像 Pixel 9 Pro XL 等 Pixel 设备通常会获得早期访问,但三星、OnePlus 以及其他旗舰 Android 手机也同样支持。对于 iOS 用户,从 App Store 更新 Google 应用即可启用应用内的 Gemini 功能,是否安装独立的 Gemini 应用可为可选项。

我需要单独安装 Gemini 应用吗?

虽然 Google Play 上的 Gemini 应用(ID: com.google.android.apps.bard)提供完整的功能集——例如日程操作和高级聊天工具——但Gemini 也内置在 Google 应用中,无需额外安装即可获得核心对话式 AI。安装独立应用可解锁:

  • Scheduled Actions:提前规划任务或设置重复提醒。
  • Deep Integration:即便禁用后台活动跟踪,也可直接控制手机功能(通话、信息、智能家居设备)。

如何启用并配置 Gemini 设置?

Gemini 需要哪些权限?

要充分发挥 Google Gemini 的能力,请授予以下权限:

  • 麦克风访问权限,用于语音指令。
  • 短信和通话记录,用于通过语音发送短信或拨打电话。
  • 日历和联系人,用于管理事件与邀请他人。
  • 照片库,用于 “Ask Photos” 图像搜索。
    初始设置期间 Google 会提示上述权限;你可稍后在 Settings > Apps > Gemini > Permissions 中进行调整。

我如何控制应用连接与数据使用?

自 2025 年 7 月 7 日起,即使你禁用 Gemini Apps Activity,Google Gemini 也可访问 Phone、Messages 和 WhatsApp 等应用,以不间断地执行任务。但你仍拥有完整控制权:

  1. 打开 GoogleGemini 应用。
  2. 前往 Settings > Gemini Apps Activity
  3. 切换 Allow App Connections 开关为开或关。
    禁用连接将停止用于模型训练的数据共享,但出于安全与故障排除目的,Google 可能会临时保留最长 72 小时的会话历史。

Gemini 在你的手机上可以执行哪些任务?

Gemini 如何处理通信任务?

Google Gemini 可以通过语音命令或输入提示来发送短信或拨打电话:

  • “嘿 Gemini,给 John 发短信:我会在下午 6 点到。”
  • “在 WhatsApp 上给妈妈打电话。”
    它可跨 SMS、WhatsApp,甚至 Gmail 撰写邮件,实现无需触摸键盘的通信流程。

Google Gemini 如何提升你的生产力?

使用 Gemini 创建日历事件、设置提醒并撰写文档:

  • 安排会议:“创建一个下周一上午 10 点的项目评审日历事件。”
  • 撰写邮件:“写一封邮件给 HR,申请休假批准。”
  • 同步笔记:“把‘买打印机墨盒’添加到我的 Google Keep。”
    这些操作利用了在 I/O 预览的 Gemini Live 功能,将 AI 直接连接到 Google Keep、Calendar 和 Tasks 应用。

Google Gemini 提供哪些媒体控制?

Google Gemini 可以管理你的媒体播放和设备设置:

  • “在 Spotify 播放我的健身播放列表。”
  • “开启‘请勿打扰’直到晚上 8 点。”
    随着 7 月的推出,Gemini 即便在没有明确后台权限的情况下也能控制媒体应用,为司机和多任务处理用户带来免手操作的便利。

如何使用 Gemini 整理和搜索照片?

什么是 Ask Photos?它如何工作?

Ask Photos 使用 Gemini AI 为你的照片库建立索引,支持按内容搜索:

  • “给我看去年夏天的海滩照片。”
  • “找找我家狗狗玩取物游戏的照片。”
    最近的更新大幅降低了查询响应时间,会先在网格中即时显示初始结果,同时在后台优化推荐。

如何启用 Ask Photos?

  1. 在手机上打开 Google Photos
  2. 点击 Search 栏并选择 Ask Photos
  3. 若提示,授予 Photo Access
  4. 输入或说出你的查询。
    该功能正在向美国 18+ 英语用户推出,后续将更广泛开放。

如何将 Gemini 与原生应用集成?

Gemini 能为你的邮件做摘要吗?

Gmail 正在测试直接在收件箱中的 AI 驱动邮件摘要,利用 Gemini 将冗长的邮件线程浓缩为要点,无需逐一打开消息。虽然仍处于测试阶段(在 Gmail 应用 2025.06.22 版中发现的代码引用),预计将提供实时摘要卡片和反馈选项,以提升 AI 准确性。

Gemini 如何与 Google Maps 和笔记协作?

在 I/O 2025 上,Google 宣布了 Gemini 与 Google Maps 的集成,可通过聊天进行路线规划与地点搜索。例如:

  • “查找 2 英里内的咖啡店。”
  • “导航回家。”
    此外,Gemini Live 可通过语音或相机输入向 Keep 添加笔记(例如拍摄包含活动详情的海报),并根据视觉线索自动创建任务或日历条目。

如何在使用 Google Gemini 时维护隐私与安全?

Gemini 收集哪些数据?

  • 语音与文本输入:发送至 Google 服务器进行处理。
  • 应用使用信号:用于确定上下文(例如控制媒体)。
  • 临时会话日志:在关闭 Apps Activity 时,最多保留 72 小时以用于安全与故障排除,随后删除。

如何调整隐私设置?

  1. Google/Gemini 应用中,前往 Settings > Data & Privacy
  2. 选择 Manage Your Activity Controls
  3. 关闭 Web & App ActivityVoice & Audio Activity 等类别,以限制数据保留。
    你也可以在 Google 账号的 My Activity 中手动删除过去的录音与文本日志。

Google Gemini 在移动端有哪些即将到来的新功能?

Gemini 何时会完全取代 Google Assistant?

自 2025 年末开始,Google 计划在 Android 上以 Gemini 取代 Google Assistant,将 AI 嵌入操作系统核心,以实现更深入的功能控制与更智能的设备交互。从 7 月 7 日起,Gemini 将获得几乎完整的手机功能访问权限,甚至可绕过此前的权限障碍。

你可以期待哪些即将到来的增强?

  • 更广泛的推出:“Ask Photos”和邮件摘要将全球扩展。
  • 增强的 AI 模式Deep ThinkProject Mariner 功能在移动端更广泛可用。
  • 教育工具:Gemini for Education 在更多国家增加自定义 AI 专家与个性化学习测验。
  • 开发者集成:第三方应用将很快通过 Gemini 的 API 获取特定于应用的能力,延伸到 Google 生态之外。

按照本指南,你将充分发挥手机上 Google Gemini 的潜力——简化沟通、提升生产力,并享受强大的 AI 驱动功能,同时保持对你的数据与隐私的控制。随着 Google 不断增强 Gemini 的能力,及时关注应用发布与博客公告,是在移动设备上利用最新 AI 创新的关键。

入门

CometAPI 是一个统一的 API 平台,将来自顶级提供商的 500+ AI 模型(例如 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude、Midjourney、Suno 等)聚合到一个对开发者友好的接口中。通过提供一致的认证、请求格式与响应处理,CometAPI 显著简化了在应用中集成 AI 能力的过程。无论你在构建聊天机器人、图像生成器、音乐创作工具,还是数据驱动的分析管道,CometAPI 都能让你更快迭代、控制成本、保持供应商无关,同时利用 AI 生态的最新突破。

开发者可通过 CometAPI 访问 Gemini-2.5 Pro Preview APIGemini-2.5 Flash Pre API,最新模型列表以本文发布之日为准。开始使用前,可在 Playground 探索模型能力,并参考 API guide 获取详细说明。访问前,请确保你已登录 CometAPI 并获取 API key。CometAPI 提供远低于官方价格的费用,帮助你完成集成。

阅读更多

一个 API 中超 500 个模型

最高 20% 折扣