def duomotaiocr(): def local_image_to_data_uri(image_path: str) -> str | None: """本地图片转为 data URI 格式(适配 image_url 字段)""" try: # 获取图片后缀 ext=image_path.split('.')[-1].lower() if ext not in ('png', 'jpg', 'jpeg'): print("仅支持png/jpg/jpeg格式") return None with open(image_path, "rb") as img_file: base64_str=base64.b64encode(img_file.read()).decode("utf-8") # 关键:包装成 data URI 格式 return f"data:image/{ext};base64,{base64_str}" except Exception as e: print(f"图片编码失败: {e}") return None import os from pathlib import Path from openai import OpenAI import pandas as pd client = OpenAI( # 若没有配置环境变量,请用百炼API Key将下行替换为:api_key="sk-xxx" api_key=api_key, base_url="https://dashscope.aliyuncs.com/compatible-mode/v1", ) file_object = client.files.create(file=Path("./结算单.pdf"), purpose="file-extract") completion = client.chat.completions.create( model="qwen2.5-vl-72b-instruct", # 模型列表:https://help.aliyun.com/zh/model-studio/getting-started/models messages= [ { "role": "user", "content": [ { "type": "text", "text": "描述下图片里的内容" }, { "type": "image_url", # 需要注意,Base64,图像格式(即image/{format})需要与支持的图片列表中的Content Type保持一致。"f"是字符串格式化的方法。 # PNG图像: f"data:image/png;base64,{base64_image}" # JPEG图像: f"data:image/jpeg;base64,{base64_image}" # WEBP图像: f"data:image/webp;base64,{base64_image}" "image_url": { "url": f"{local_image_to_data_uri('1.png')}" } } ] } ] ) a=completion.choices[0].message.content print(a) with open('output.csv', mode='w', encoding='utf-8') as file: file.write(a) return 'result.xlsx'大模型多模态调用
张小明
前端开发工程师
MAA助手使用指南与常见故障排除大全
MAA助手使用指南与常见故障排除大全 【免费下载链接】MaaAssistantArknights 一款明日方舟游戏小助手 项目地址: https://gitcode.com/GitHub_Trending/ma/MaaAssistantArknights 欢迎使用MAA助手!作为明日方舟游戏的智能辅助工具,我们为你准备了…
基于STM32的RS485 Modbus协议源代码实战案例解析
手把手教你用STM32实现RS485 Modbus通信:从硬件到协议的完整实战你有没有遇到过这样的场景?一个工业现场,十几台温湿度传感器分布在百米之外的各个角落,需要统一上传数据给PLC或上位机。布线复杂、干扰严重、通信时不时“掉包”……
Holistic Tracking vs MediaPipe Separate模型部署效率对比
Holistic Tracking vs MediaPipe Separate模型部署效率对比 1. 引言:为何需要全维度人体感知的性能对比? 随着虚拟现实、数字人和智能交互系统的快速发展,对高精度、低延迟的人体感知能力提出了更高要求。传统的单任务模型(如仅…
LINUX练习1
1.在/opt目录下创建临时目录tmp2.在临时目录下创建一个文件a.txt3.用vi命令在tmp下创建一个newfile文件,在首行写日期时间命令:vi newfile4.将/boot/grub2/grub.cfg文档内容读入到newfile中命令::r /boot/grub2/grub.cfg5.查找newfile中#符号…
G-Helper 终极使用指南:释放华硕笔记本潜能
G-Helper 终极使用指南:释放华硕笔记本潜能 【免费下载链接】g-helper Lightweight Armoury Crate alternative for Asus laptops. Control tool for ROG Zephyrus G14, G15, G16, M16, Flow X13, Flow X16, TUF, Strix, Scar and other models 项目地址: https:/…
一键启动AI读脸术:WebUI镜像让年龄性别识别零门槛
一键启动AI读脸术:WebUI镜像让年龄性别识别零门槛 1. 项目背景与技术价值 在智能安防、人机交互和个性化服务等场景中,人脸属性分析正成为一项关键的底层能力。传统的深度学习方案往往依赖复杂的框架(如PyTorch或TensorFlow)和庞…