7. 案例之生成器生成批量歌词

张开发

• 2026/6/26 23:24:50 • 15 分钟阅读

分享文章

案例: 基于传入的数值(每批次的歌词条数)创建生成器生成批次歌词. 案例:基于传入的数值(每批次的歌词条数)创建生成器生成批次歌词. 很多模型都是一个批次一个批次的给模型喂数据来训练模型的。构建数据生成器每8个条数据(8个样本)8个数据的给模型喂数据; # 需求:基于文件中的歌词创建生成器根据传入的每批次的歌词条数生成歌词批次。importmath# 1.定义函数接收每批次的歌词条数返回生成器.defdataset_loader(batch_size): #自定义歌词批量生成器 :param batch_size: 每批次的歌词条数 :return: 生成器母个元素都是一批次的数据例如:(8条8条8条...) # 1.1 读取文件数据withopen(./data/data.txt,r,encodingutf-8)assrc_file:# 1.2 一次读取所有行# lines[line.strip() for line in src_file.readlines()]linessrc_file.readlines()print(lines)# 1.3 计算批次总数total_batchmath.ceil(len(lines)/batch_size)# 1.4 通过for循环方式获取到每批次的数据放到生成器中并返回foridxinrange(total_batch):#假设5批idx的值0 1 2 3 4# 第1批歌词索引(idx0)歌词为第1条-第8条索引为0-7# yield lines[0:8] #包左不包右# 第2批歌词索引(idx1)歌词为第9条-第16条索引为8-15# yield lines[8:16]# 第3批歌词索引(idx2)歌词为第17条-第24条索引为16-23# yield lines[16:24]yieldlines[idx*batch_size:(idx1)*batch_size]# 2.测试dlinedataset_loader(8)# print(next(dline)) # 第一批# print(next(dline)) # 第二批forbatch_dataindline:print(batch_data)

7. 案例之生成器生成批量歌词

最新文章

从芯片制造到电路设计：为什么CMOS工艺偏爱P型衬底？聊聊背后的历史与技术选择

【GraalVM静态镜像内存优化终极指南】：20年JVM专家亲授，从启动内存暴增300%到稳定＜25MB的7大实战压测技巧

TVA技术在洗煤车间检测中的场景适配与工艺优化

别只当数据搬运工了！深入STM32H7的DMA FIFO与突发传输，提升你的系统带宽（内存位宽不匹配怎么办）

大数据应用开发赛项备赛指南：从零开始掌握电商与工业互联网数据集处理

别再全局改MyBatis-Plus的maxLimit了！3.4版本后这样按需突破分页限制更安全

推荐文章

相关文章

分享文章

更多文章

CMake项目管理进阶：对比FetchContent、ExternalProject与git submodule，哪种引入第三方库方式更适合你？

从抓包到模拟：手把手教你用Python复现抖音火山版device_id与install_id生成流程

别再只盯着操作系统了！揭秘服务器‘第二大脑‘BMC的IP配置与实战价值

2025届必备的十大降重复率助手推荐

告别满屏红波浪！手把手教你配置VSCode的includePath，让STM32CubeIDE工程丝滑编码

用51单片机+红外传感器DIY循迹小车，我的毕业设计避坑实录（附完整C代码）

从Optional容器到NPE：Java Stream findAny()方法处理null值的完整避坑手册

Python类型守卫深度解析

终极指南：使用SerialPlot实现串口数据可视化监控的完整教程

生物信息学必备：用R语言密度图揪出测序数据中的异常分布（含带宽调整技巧）

MySQL数据库磁盘写满后如何紧急处理_清理日志与扩容空间

ANSYS APDL谐响应分析实战：悬臂梁频响函数的MATLAB后处理与可视化