如何在手机上使用 Google Gemini

Google Gemini 标志着移动 AI 的新时代，在 Android 和 iOS 环境中深度集成，提供强大的对话能力。无论是免手动发送信息、管理日程，还是通过自然语言整理照片，Gemini 都致力于成为你处理日常任务的首选助手。本综合指南涵盖从初始设置到高级功能使用的全部内容，提供清晰步骤、实用示例以及隐私注意事项。

什么是 Google Gemini？

Gemini 与 Google Assistant 有何不同？

Google Gemini 代表了 Google AI 助手的下一代产品，依托 Gemini 2.5 模型系列，提供比前代更丰富、更加具备上下文感知的交互。在 Google I/O 2025 上，Google 展示了诸如 Deep Think（面向复杂问题求解的实验性推理模式）和更自然的对话体验的原生音频输出等增强功能。这些升级使 Gemini 能以更高的准确性和流畅度处理复杂任务——例如分步编码协助或深入研究查询——比旧版 Assistant 更胜一筹。

Gemini 2.5 的关键改进是什么？

Gemini 2.5 引入了多项核心增强：

高级推理模式（“Deep Think”），用于应对复杂的数学与编码挑战。
Project Mariner 能力，使 AI 能与设备功能交互（例如发送信息、打开应用）。
增强的安全防护，在保障用户数据的同时保持流畅的 AI 性能。
LearnLM 集成，面向教育场景，Gemini for Education 在多个国家为学生和教师提供个性化测验与学习辅助。

总体而言，这些增强使 Gemini 不仅是对话伙伴，更是生产力、创意和学习的多功能工具。

如何在手机上使用 Gemini？

哪些设备支持 Google Gemini？

Google Gemini 首先在运行 Android 10 或更高版本且至少 2 GB RAM 的现代 Android 设备上推出；它也可通过 iOS 上的 Google 应用访问。像 Pixel 9 Pro XL 等 Pixel 设备通常会获得早期访问，但三星、OnePlus 以及其他旗舰 Android 手机也同样支持。对于 iOS 用户，从 App Store 更新 Google 应用即可启用应用内的 Gemini 功能，是否安装独立的 Gemini 应用可为可选项。

我需要单独安装 Gemini 应用吗？

虽然 Google Play 上的 Gemini 应用（ID: com.google.android.apps.bard）提供完整的功能集——例如日程操作和高级聊天工具——但Gemini 也内置在 Google 应用中，无需额外安装即可获得核心对话式 AI。安装独立应用可解锁：

Scheduled Actions：提前规划任务或设置重复提醒。
Deep Integration：即便禁用后台活动跟踪，也可直接控制手机功能（通话、信息、智能家居设备）。

如何启用并配置 Gemini 设置？

Gemini 需要哪些权限？

要充分发挥 Google Gemini 的能力，请授予以下权限：

麦克风访问权限，用于语音指令。
短信和通话记录，用于通过语音发送短信或拨打电话。
日历和联系人，用于管理事件与邀请他人。
照片库，用于 “Ask Photos” 图像搜索。
初始设置期间 Google 会提示上述权限；你可稍后在 Settings > Apps > Gemini > Permissions 中进行调整。

我如何控制应用连接与数据使用？

自 2025 年 7 月 7 日起，即使你禁用 Gemini Apps Activity，Google Gemini 也可访问 Phone、Messages 和 WhatsApp 等应用，以不间断地执行任务。但你仍拥有完整控制权：

打开 Google 或 Gemini 应用。
前往 Settings > Gemini Apps Activity。
切换 Allow App Connections 开关为开或关。
禁用连接将停止用于模型训练的数据共享，但出于安全与故障排除目的，Google 可能会临时保留最长 72 小时的会话历史。

Gemini 在你的手机上可以执行哪些任务？

Gemini 如何处理通信任务？

Google Gemini 可以通过语音命令或输入提示来发送短信或拨打电话：

“嘿 Gemini，给 John 发短信：我会在下午 6 点到。”
“在 WhatsApp 上给妈妈打电话。”
它可跨 SMS、WhatsApp，甚至 Gmail 撰写邮件，实现无需触摸键盘的通信流程。

Google Gemini 如何提升你的生产力？

使用 Gemini 创建日历事件、设置提醒并撰写文档：

安排会议：“创建一个下周一上午 10 点的项目评审日历事件。”
撰写邮件：“写一封邮件给 HR，申请休假批准。”
同步笔记：“把‘买打印机墨盒’添加到我的 Google Keep。”
这些操作利用了在 I/O 预览的 Gemini Live 功能，将 AI 直接连接到 Google Keep、Calendar 和 Tasks 应用。

Google Gemini 提供哪些媒体控制？

Google Gemini 可以管理你的媒体播放和设备设置：

“在 Spotify 播放我的健身播放列表。”
“开启‘请勿打扰’直到晚上 8 点。”
随着 7 月的推出，Gemini 即便在没有明确后台权限的情况下也能控制媒体应用，为司机和多任务处理用户带来免手操作的便利。

如何使用 Gemini 整理和搜索照片？

什么是 Ask Photos？它如何工作？

Ask Photos 使用 Gemini AI 为你的照片库建立索引，支持按内容搜索：

“给我看去年夏天的海滩照片。”
“找找我家狗狗玩取物游戏的照片。”
最近的更新大幅降低了查询响应时间，会先在网格中即时显示初始结果，同时在后台优化推荐。

如何启用 Ask Photos？

在手机上打开 Google Photos。
点击 Search 栏并选择 Ask Photos。
若提示，授予 Photo Access。
输入或说出你的查询。
该功能正在向美国 18+ 英语用户推出，后续将更广泛开放。

如何将 Gemini 与原生应用集成？

Gemini 能为你的邮件做摘要吗？

Gmail 正在测试直接在收件箱中的 AI 驱动邮件摘要，利用 Gemini 将冗长的邮件线程浓缩为要点，无需逐一打开消息。虽然仍处于测试阶段（在 Gmail 应用 2025.06.22 版中发现的代码引用），预计将提供实时摘要卡片和反馈选项，以提升 AI 准确性。

Gemini 如何与 Google Maps 和笔记协作？

在 I/O 2025 上，Google 宣布了 Gemini 与 Google Maps 的集成，可通过聊天进行路线规划与地点搜索。例如：

“查找 2 英里内的咖啡店。”
“导航回家。”
此外，Gemini Live 可通过语音或相机输入向 Keep 添加笔记（例如拍摄包含活动详情的海报），并根据视觉线索自动创建任务或日历条目。

如何在使用 Google Gemini 时维护隐私与安全？

Gemini 收集哪些数据？

语音与文本输入：发送至 Google 服务器进行处理。
应用使用信号：用于确定上下文（例如控制媒体）。
临时会话日志：在关闭 Apps Activity 时，最多保留 72 小时以用于安全与故障排除，随后删除。

如何调整隐私设置？

在 Google/Gemini 应用中，前往 Settings > Data & Privacy。
选择 Manage Your Activity Controls。
关闭 Web & App Activity 或 Voice & Audio Activity 等类别，以限制数据保留。
你也可以在 Google 账号的 My Activity 中手动删除过去的录音与文本日志。

Google Gemini 在移动端有哪些即将到来的新功能？

Gemini 何时会完全取代 Google Assistant？

自 2025 年末开始，Google 计划在 Android 上以 Gemini 取代 Google Assistant，将 AI 嵌入操作系统核心，以实现更深入的功能控制与更智能的设备交互。从 7 月 7 日起，Gemini 将获得几乎完整的手机功能访问权限，甚至可绕过此前的权限障碍。

你可以期待哪些即将到来的增强？

更广泛的推出：“Ask Photos”和邮件摘要将全球扩展。
增强的 AI 模式：Deep Think 与 Project Mariner 功能在移动端更广泛可用。
教育工具：Gemini for Education 在更多国家增加自定义 AI 专家与个性化学习测验。
开发者集成：第三方应用将很快通过 Gemini 的 API 获取特定于应用的能力，延伸到 Google 生态之外。

按照本指南，你将充分发挥手机上 Google Gemini 的潜力——简化沟通、提升生产力，并享受强大的 AI 驱动功能，同时保持对你的数据与隐私的控制。随着 Google 不断增强 Gemini 的能力，及时关注应用发布与博客公告，是在移动设备上利用最新 AI 创新的关键。

入门

CometAPI 是一个统一的 API 平台，将来自顶级提供商的 500+ AI 模型（例如 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude、Midjourney、Suno 等）聚合到一个对开发者友好的接口中。通过提供一致的认证、请求格式与响应处理，CometAPI 显著简化了在应用中集成 AI 能力的过程。无论你在构建聊天机器人、图像生成器、音乐创作工具，还是数据驱动的分析管道，CometAPI 都能让你更快迭代、控制成本、保持供应商无关，同时利用 AI 生态的最新突破。

开发者可通过 CometAPI 访问 Gemini-2.5 Pro Preview API 和 Gemini-2.5 Flash Pre API，最新模型列表以本文发布之日为准。开始使用前，可在 Playground 探索模型能力，并参考 API guide 获取详细说明。访问前，请确保你已登录 CometAPI 并获取 API key。CometAPI 提供远低于官方价格的费用，帮助你完成集成。