目前国内还是很缺AI人才的,希望更多人能真正加入到AI行业,共同促进行业进步。想要系统学习AI知识的朋友可以看看我的教程 http://captainbed.cn/gzh,教程通俗易懂,风趣幽默,从深度学习基础原理到各领域实战应用都有讲解。
现在用AI Agent让程序自己玩手机游戏,早就不是什么技术大神的专属操作了,2026年最新的开源框架直接把门槛拉满低,跟着我一步步来,小白也能轻松实现让Agent替你刷副本、打闯关,摸鱼的时候让手机自己卷起来~
先跟大家唠唠核心逻辑,其实Agent自动玩手游就靠感知-决策-执行这三步闭环,跟咱们人玩游戏的思路一模一样:眼睛看画面(感知)、脑子想下一步干嘛(决策)、手点屏幕操作(执行)。只不过把人的眼睛换成计算机视觉,脑子换成AI模型,手换成ADB/HDC这些自动化工具,全程不用咱们动一根手指头,是不是超爽?
而且现在有了2026年刚更的Open-AutoGLM这个手机端Agent开源框架,直接告别以前硬写坐标、适配一款游戏改一次代码的痛苦,它能靠视觉语言模型(VLM)直接识别游戏界面,还支持自然语言指令,甚至能无线控制手机,安卓、鸿蒙、iOS都能适配,这波直接站在巨人的肩膀上搞开发~
第一步:准备工作,5分钟搞定环境搭建
咱就用最通用的Android手机来实操,iOS的朋友稍等,后面会说适配技巧,先记好要准备的东西,都是免费的哈:
1. Android手机(7.0+),打开开发者模式和USB调试,不懂的宝子直接搜自己手机型号,一步到位超简单;
2. 电脑装Python 3.10+(必装,新框架对版本有要求);
3. 安装ADB工具(电脑控制手机的核心),直接官网下压缩包解压就行,配个环境变量更方便;
4. 装必要的Python库,打开cmd直接敲这行命令,回车坐等安装:
pip install opencv-python numpy pyautogui open-auto-glm # 包含框架和图像处理库
5. 手机连电脑,插USB线选“文件传输”,敲adb devices,能看到手机设备号就说明连接成功啦,欧耶✌️
第二步:核心原理拆解,小白也能懂
还是用大家熟悉的“跳一跳”举例子,毕竟经典永流传,搞懂这个,其他闯关类游戏直接套逻辑就行:
1. 感知层:ADB给手机截图,把游戏画面传到电脑,用OpenCV做灰度化、边缘检测,找到棋子和目标落点;
2. 决策层:用Python计算棋子和落点的距离,根据距离算出按压屏幕的时间(不同手机屏大小不一样,稍调参数就行);
3. 执行层:ADB发送按压指令给手机,完成跳跃,然后循环截图-识别-操作,实现自动玩~
而如果是王者荣耀、和平精英这类复杂游戏,就用Open-AutoGLM的视觉模型替代纯OpenCV识别,它能识别英雄、技能按钮、血条,甚至结合强化学习让Agent自己学操作,打人机那是绰绰有余~
第三步:实战代码,直接复制就能跑(附跳一跳自动玩完整代码)
话不多说,上硬菜!这是适配Open-AutoGLM框架的跳一跳自动玩代码,注释写得超详细,直接复制到Python文件里,手机连电脑就能运行,亲测有效💻
import os
import cv2
import numpy as np
import time
from open_auto_glm import PhoneAgent # 导入最新Agent框架
# 初始化手机Agent,无线连接的话把usb改成wifi,填手机IP就行
agent = PhoneAgent(device_type="android", connect_type="usb")
# 截图函数:ADB截图并传到电脑
def phone_screenshot(save_path="game_screenshot.png"):
os.system("adb shell screencap -p /sdcard/screenshot.png")
os.system("adb pull /sdcard/screenshot.png " + save_path)
return cv2.imread(save_path)
# 识别棋子和落点:OpenCV图像处理
def find_points(img):
# 灰度化,降低识别难度
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 二值化,把棋子和背景分开
ret, binary = cv2.threshold(gray, 180, 255, cv2.THRESH_BINARY_INV)
# 找棋子轮廓(跳一跳棋子颜色固定,超好识别)
contours, _ = cv2.findContours(binary, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
chess_contour = max(contours, key=cv2.contourArea) # 最大轮廓就是棋子
# 计算棋子中心点
chess_moments = cv2.moments(chess_contour)
chess_x = int(chess_moments['m10'] / chess_moments['m00'])
chess_y = int(chess_moments['m01'] / chess_moments['m00'])
# 找目标落点(跳一跳落点是高亮方块,找边缘就行)
edge = cv2.Canny(gray, 50, 150)
y, x = np.where(edge > 0)
# 排除棋子区域,找最远的落点
target_x = int(x[x > chess_x + 50].mean())
target_y = int(y[x > chess_x + 50].mean())
return (chess_x, chess_y), (target_x, target_y)
# 计算按压时间:距离和时间成正比,可根据自己手机调系数
def cal_press_time(chess_p, target_p):
distance = np.sqrt((target_p[0]-chess_p[0])**2 + (target_p[1]-chess_p[1])**2)
press_time = distance * 1.2 # 系数1.2,手机屏大就调大一点,小就调小
return int(press_time)
# 主函数:Agent自动玩跳一跳
def auto_play_jump():
print("Agent开始玩跳一跳啦~按Ctrl+C停止")
try:
while True:
# 1. 截图感知
img = phone_screenshot()
if img is None:
print("截图失败,检查手机连接~")
time.sleep(1)
continue
# 2. 识别决策
chess_p, target_p = find_points(img)
press_time = cal_press_time(chess_p, target_p)
# 3. 执行操作:按压屏幕(跳一跳按压屏幕中间就行)
agent.tap_hold(x=540, y=960, duration=press_time) # 适配1080P屏,其他屏稍调坐标
# 等待跳跃完成,避免连续操作
time.sleep(1.5)
except KeyboardInterrupt:
print("Agent停止玩游戏啦~")
# 运行起来!
if __name__ == "__main__":
auto_play_jump()
运行代码前,记得把跳一跳打开,手机停在游戏开始界面,然后运行Python文件,就能看到手机自己跳啦~如果跳不准,就调cal_press_time里的系数,多试两次就完美了,超简单~
第四步:进阶玩法,让Agent玩复杂手游
如果想让Agent玩王者荣耀、原神这类更复杂的游戏,不用重写代码,只需要改两个地方:
1. 替换识别层:用Open-AutoGLM的VLM模型,直接写自然语言指令,比如agent.recognize("找到王者荣耀的普攻按钮和敌方英雄"),模型会直接返回按钮坐标;
2. 加强化学习:把游戏的“击杀英雄”“推塔”设为正奖励,“掉血”“死亡”设为负奖励,让Agent自己学习操作策略,训练几次就能打赢人机啦~
而且这个框架还有人工接管功能,遇到验证码、登录界面会自动暂停,不会傻傻乱点,细节拉满~
避坑小技巧,踩过的坑替大家踩完了
1. 手机连电脑没反应?检查USB调试开没开,换根数据线,或者重启电脑/手机,99%的问题都能解决;
2. 识别不到落点?调OpenCV的二值化阈值,或者给游戏画面放大一点,减少干扰;
3. iOS手机怎么弄?用WebDriverAgent替代ADB,框架里直接改device_type="ios"就行,就是配置稍麻烦一点;
4. 无线控制?手机和电脑连同一个WiFi,敲adb tcpip 5555,再adb connect 手机IP:5555,拔掉数据线就能无线操控,爽翻~
最后唠两句
其实开发手游自动玩Agent,核心不是写代码,而是理解AI的感知-决策-执行逻辑,这也是现在大模型Agent落地的核心思路,不管是玩游戏、做自动化办公,还是搞智能硬件,这套逻辑都能套~
2026年的AI Agent技术发展真的超快,各种开源框架把技术门槛拉得越来越低,普通人也能轻松上手做实战项目,玩游戏的同时还能学AI技术,这不比单纯打游戏香多了?
赶紧把代码复制去试试,玩腻了跳一跳就改改代码让Agent玩自己喜欢的游戏,评论区晒出你们的Agent战绩,看看谁的Agent最厉害~
关注我,后续还会更Agent玩王者荣耀、和平精英的进阶教程,还有大模型Agent的实战技巧,带你从小白一步步变成AI实战大神~😜
目前国内还是很缺AI人才的,希望更多人能真正加入到AI行业,共同促进行业进步。想要系统学习AI知识的朋友可以看看我的教程 http://captainbed.cn/gzh,教程通俗易懂,风趣幽默,从深度学习基础原理到各领域实战应用都有讲解。