Python音乐推荐系统：Django+基于用户协同过滤（余弦相似度算法）源码-编程实验室

python音乐推荐系统音乐推荐系统源码技术栈：python+django+基于用户协同过滤，应用余弦相似度推荐思路：用户登陆系统后，听歌时会记录听歌次数，听歌的次数可以代表用户对歌曲的喜好度，一次一分，最高10分，有了记录后再应用余弦公司计算用户相似度，得到相似度矩阵，在通过相似度矩阵*用户评分矩阵得到推荐分数矩阵，按分数高低排序推荐

打开音乐App时总能看到那些"猜你喜欢"的歌单，有些推荐准得让人怀疑手机被监听了。今天咱们自己动手撸个推荐系统，用Python+Django实现基于用户的协同过滤算法，看看这背后的魔法是怎么变出来的。

先看核心数据模型设计。在models.py里咱们得记录三样东西：用户、歌曲、用户行为。代码比文字更直观：

from django.db import models class User(models.Model): username = models.CharField(max_length=50, unique=True) class Song(models.Model): title = models.CharField(max_length=200) artist = models.CharField(max_length=100) # 音频文件路径等字段... class UserPlayHistory(models.Model): user = models.ForeignKey(User, on_delete=models.CASCADE) song = models.ForeignKey(Song, on_delete=models.CASCADE) play_count = models.IntegerField(default=0) # 用Decimal类型存评分更精确 score = models.DecimalField(max_digits=3, decimal_places=1, default=0.0) class Meta: unique_together = ('user', 'song') # 防止重复记录

用户每次播放歌曲时，咱们得更新这个评分系统。注意这里有个小技巧：播放次数转评分时做了0-10分的限制，防止数据偏差过大。看看视图层怎么处理：

def record_play(request, song_id): user = request.user song = Song.objects.get(id=song_id) history, created = UserPlayHistory.objects.get_or_create( user=user, song=song ) # 播放次数+1，但不超过10次 history.play_count = min(history.play_count + 1, 10) # 直接按播放次数作为评分 history.score = history.play_count history.save() return JsonResponse({'status': 'success'})

接下来是重头戏——相似度计算。咱们用余弦相似度来衡量用户口味有多接近。别被数学名词吓到，本质上就是比较两个用户的评分向量夹角：

from collections import defaultdict from decimal import Decimal import math def cosine_similarity(user1, user2): # 获取共同评分的歌曲 common_songs = set(user1.play_history.values_list('song', flat=True)) & \ set(user2.play_history.values_list('song', flat=True)) if not common_songs: return 0.0 # 计算点积和模长 dot_product = 0 magnitude1 = 0 magnitude2 = 0 for song in common_songs: score1 = UserPlayHistory.objects.get(user=user1, song=song).score score2 = UserPlayHistory.objects.get(user=user2, song=song).score dot_product += float(score1 * score2) magnitude1 += float(score1 ** 2) magnitude2 += float(score2 ** 2) magnitude = math.sqrt(magnitude1) * math.sqrt(magnitude2) return Decimal(dot_product / magnitude) if magnitude else 0.0

这里有个性能优化点：实际生产环境应该批量查询而不是循环内查数据库，但示例代码保持简洁优先。缓存用户评分数据能显著提升速度。

最后是推荐算法本体，这步相当于把相似用户的喜好"借"过来：

def generate_recommendations(user, top_n=10): all_users = User.objects.exclude(id=user.id) similarity_cache = {} # 缓存相似度计算结果 # 构建评分预测字典 recommendations = defaultdict(float) for other_user in all_users: # 相似度超过0.7才考虑 sim = cosine_similarity(user, other_user) if sim < 0.7: continue # 遍历相似用户听过的歌 for history in other_user.play_history.all(): if not user.play_history.filter(song=history.song).exists(): # 加权评分累加 recommendations[history.song] += float(sim * history.score) # 按评分排序取TopN sorted_songs = sorted(recommendations.items(), key=lambda x: x[1], reverse=True)[:top_n] return [song for song, _ in sorted_songs]

在前端展示推荐结果时，用Django模板引擎循环输出即可。注意要排除用户已经听过的歌曲，这个过滤逻辑在模板里可以直接处理：

<div class="recommend-box"> <h3>根据您的口味推荐</h3> <ul> {% for song in recommended_songs %} {% if song not in played_songs %} <li>{{ song.title }} - {{ song.artist }}</li> {% endif %} {% endfor %} </ul> </div>

这个系统在实际使用时会遇到冷启动问题——新用户没数据时怎么推荐？可以准备个热门歌曲榜单作为兜底方案。另一个要注意的是数据稀疏性，当用户量增大时需要考虑降维处理，或者改用矩阵分解等更高效的方法。但作为入门级的协同过滤实现，这个版本已经能展现推荐系统的核心逻辑了。

多机多卡分布式训练：TensorFlow镜像中的TF_CONFIG配置详解

多机多卡分布式训练：TensorFlow镜像中的TF_CONFIG配置详解在现代深度学习系统中，随着模型参数量突破百亿甚至千亿级别，单张GPU早已无法承载完整的训练任务。我们经常遇到这样的场景：一个推荐系统的Embedding层就占用了超过40GB显…

李华

Open-AutoGLM入门到精通（核心功能全解析）

第一章：Open-AutoGLM 完全指南Open-AutoGLM 是一个开源的自动化通用语言模型集成框架，专为简化大模型任务编排、推理优化与多源工具调用而设计。它支持自然语言驱动的任务解析，能够将用户指令自动转化为可执行的工作流，并与外部AP…

李华

小学生0基础学大语言模型应用（第5课《运算符王国》）

一、AI 小探险家：🏰《运算符王国真正的大冒险》🌍 第一章：国王的考验通过前几节课的学习，你已经学会了：用盒子装东西（变量）用数字做简单计算有一天， Python 王国的国王召…

李华

使用Notary对TensorFlow镜像进行内容信任签名

使用 Notary 对 TensorFlow 镜像进行内容信任签名在金融、医疗等高安全要求的行业中，一次看似普通的模型部署可能潜藏巨大风险。设想这样一个场景：某银行的 AI 团队从公共镜像仓库拉取了一个标为 tensorflow/tensorflow:2.13.0-gpu 的镜像用于训练反欺诈…

李华

如何监控TensorFlow镜像中GPU利用率和温度状态

如何监控TensorFlow镜像中GPU利用率和温度状态在现代AI系统的生产部署中，一个看似不起眼的问题却常常引发连锁反应：训练任务突然变慢、模型收敛停滞，甚至服务器自动重启。排查日志后发现，罪魁祸首竟是GPU过热导致的降频——而这本…

李华

如何为团队申请批量TensorFlow镜像使用权

如何为团队申请批量 TensorFlow 镜像使用权在企业级 AI 工程实践中，一个看似简单的问题——“为什么我拉不了这个 TensorFlow 镜像？”——往往背后隐藏着复杂的权限、安全和协作机制。随着机器学习项目从个人实验走向团队协作与生产部署，环境…