最近我在这个路线上进行了一下实践,分享一下成果。
做了什么
一个桌面端私有即时通讯软件,取名 unobox 。
如果你喜欢 Telegram 的三栏布局、群组/Channel/Bot/话题/投票,但又想要数据自己掌控——那它可能对你的胃口。
v0.1.0 花了大约 20 天( 2026 年 5 月初),之后的 40 天又迭代了 8 个版本。代码是用 Claude + Gemini + DeepSeek 辅助写的,人类管架构和决策,AI 填代码细节。
这是目前 v0.2.2 的样子:
[📸 截图 1:主界面 - 亮色/暗色主题各一张] [📸 截图 2:AI 聊天界面 - 8 模型选择+流式输出]
主要功能
比较有特色的几个点:
📖 EPUB 有声书 + TTS 朗读 聊天软件里做有声书阅读器,能逐句朗读、调节语速、导出成 WAV/MP3 。这个方向目前市面上应该没有 IM 做过。
[📸 截图 3:有声书阅读界面 + TTS 朗读面板]
🤖 8 种 AI 模型原生集成 不是 Bot 对接,是直接内嵌到聊天输入框。OpenAI / Claude / Gemini / DeepSeek / Qwen / MiniMax / OpenRouter / 自定义 全支持,流式逐字输出 + 思考过程可视化 + 会话持久化。
🎨 Telegram 风格 UI 三栏布局、深色/浅色主题、群组/Channel/Bot 框架、话题模式、投票、冷却、贴纸(内置 14 款 SVG )——如果你喜欢 Telegram 的交互,上手没有学习成本。
📄 全格式文件预览 Word / Excel / CSV / EPUB / PDF / Markdown 直接聊天窗口内看,不需要装 Office 。
🌐 内置浏览器 + 三层视频嗅探 聊天中链接直接打开独立浏览器,自动嗅探页面的视频资源( URL 正则 → Content-Type → JS 注入),嗅到的 M3U8/MP4 可以弹出播放器观看。
📬 定时消息调度器 主进程持久化调度,重启不丢失,带管理面板可以看待发送列表和倒计时。
🐛 内置反馈系统 客户端里直接提 Bug / 功能建议 → GitHub Issues ,自动附带环境信息(版本、系统、Electron 版本)。
技术栈
Electron 32 / React 18 / TypeScript 5 / Zustand / Turborepo pnpm monorepo / better-sqlite3 支持本地 SQLite 离线、自建 WebSocket 局域网、Matrix 联邦网络 三种模式。
坦承不足
老实说,这不是一个完美的产品,目前还有明显短板:
- ❌ 没有移动端( scaffold 阶段,正在做)
- ❌ 没有端到端加密(排期里)
- ❌ macOS 未签名(需要走 Gatekeeper 放行,官网有教程)
- ❌ 源码未开源(核心包计划逐步开放)
- ❌ 没有实时音视频通话
想表达的一点想法
这个项目最让我意外的是开发和迭代速度。
以前一个人做这种规模的话,第一个版本至少 3-6 个月起步。但现在有 AI 辅助编码,节奏变成了"周末两天 + 工作日晚上"就能推一个带新功能的版本。
这其实才是这个产品最有意思的地方——它证明了一个人 + AI 可以做到什么程度。如果你也在探索 AI 辅助开发,欢迎交流。
试用方式
官网(有下载 + 教程): https://unobox.zhenzhidaole.com GitHub Releases ( Windows/macOS/Linux ): https://github.com/samjoeyang/unobox-release/releases
完全免费,不需要注册账号,下载即用。
欢迎任何反馈和建议 🙏