news 2026/5/1 9:07:52

字符集及其编码、解码操作、IO流分类

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
字符集及其编码、解码操作、IO流分类

字符集

1、ASCII字符集:一个字节(8位)存储一个字符(大小写字母,数字或特殊符号)
2、ASCII字符集中一个字节八位实际有效的只有后七位,第一位都是0
3、GBK字符集(汉字内码扩展规范,国标)包括了ASCII,两个字节存储一个汉字字符
4、GBK规定:汉字的第一个字节的第一位必须是1,与ASCII第一位必须是0区分开来,用于在一句话中区分ASCII(一个字节)和GBK(两个字节)
5、Unicode字符集(统一码,也叫万国码),UTF-32字符集每四个字节表示一个字符,虽然容纳的多,但是占空间多,通信效率变低


6、UTF-8字符集是Unicode字符集的一种编码方案,长度区分1个字节、2个字节、3个字节、4个字节。技术

要点回顾

字符编码和解码时使用的字符集必须一样,否则会出现乱码,

字符集的编码、解码操作

packagecom.itheima.demo3character;importjava.io.UnsupportedEncodingException;importjava.nio.charset.Charset;importjava.util.Arrays;publicclassCharSetDemo1{publicstaticvoidmain(String[]args)throwsUnsupportedEncodingException{//目标:写程序实现字符编码和解码//1、编码(成字节形式,再转化成十进制)Stringname="本尊!!!";byte[]bytes=name.getBytes("GBK");//指定GBK进行编码System.out.println(bytes.length);//7System.out.println(Arrays.toString(bytes));//[-79, -66, -41, -16, 33, 33, 33]//2、解码(成我能看懂的)//String name2 = new String(bytes);//编码与解码不一致,会乱码Stringname3=newString(bytes,"GBK");//指定GBK进行解码//System.out.println(name2);//����!!!System.out.println(name3);//本尊!!!}}

IO流

I指Input,称为输入流:富足把数据读到内存中去
O指Ouput,称为输出流:负责写数据出去

IO流的分类

IO流的体系:字节输入流、字节输出流、字符输入流、字符输出流

小结

IO流-文件字节输入流

1、字节输入流InputStream、字节输出流OutputStream、字符输入流Reader、字符输出流Writer都是抽象类
2、FileInputStream、FileOutputStream、FileReader、FileWriter是对应以上的实现类


3、文件字节输入流FileInputStream的作用是把磁盘文件中的数据以字节的形式读入到内存中去

packagecom.itheima.demo4fileinputstream;importjava.io.*;publicclassFileInputDemo1{publicstaticvoidmain(String[]args)throwsIOException{//目标:掌握文件字节输入流读取文件中的字节数组到内存中来//1、创建文件字节对象 输入流管道于源文件接通InputStreamis=newFileInputStream(newFile("day03-file-io\\src\\lll02"));//2、创建文件字节路径 输入流管道与源文件接通//InputStream is2 = new FileInputStream("day03-file-io\\src\\lll02");//两个是一样的,简化写法InputStreamis2=newFileInputStream("day03-file-io\\src\\lll03");//3、读取文件中的字节并输出//定义一个变量记住每次读取的一个字节intb;while((b=is.read())!=-1)//按顺序判断内容对应的ASCII字符是否等于-1{System.out.print((char)b);}//每次读取一个字节的问题,性能较差,读取汉字输出一定会乱码//4、读取文件中的字节数组并输出,每次读取多个字节//定义一个字节数组,每次读取多个字节byte[]bytes=newbyte[3];//定义一个变量记住每次读取多少个字节,读取多少倒多少intlen;while((len=is2.read(bytes))!=-1){System.out.println(newString(bytes,0,len));//abc//666//g}}}
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/1 8:02:21

什么是 CMS 站群系统?以及它在百度 SEO 中的真实作用

在做网站矩阵、内容覆盖或 SEO 项目时,很多人都会听到一个词——CMS 站群系统。 但这个概念在实际使用中,经常被误解成“多个 CMS 拼在一起”,甚至被简单等同于泛目录工具,这种理解并不准确。本文从实际使用和搜索引擎角度&#x…

作者头像 李华
网站建设 2026/5/1 7:57:26

深度光流学习粒子图像测速算法研究

✨ 本团队擅长数据搜集与处理、建模仿真、程序设计、仿真代码、论文写作与指导,毕业论文、期刊论文经验交流。✅ 专业定制毕设、代码✅ 成品或定制,查看文章底部微信二维码(1)基于轻量级光流模型的粒子图像测速算法粒子图像测速技…

作者头像 李华
网站建设 2026/4/25 7:22:15

基于深度学习的注塑工件表面缺陷检测

✨ 本团队擅长数据搜集与处理、建模仿真、程序设计、仿真代码、论文写作与指导,毕业论文、期刊论文经验交流。✅ 专业定制毕设、代码✅ 成品或定制,查看文章底部微信二维码(1)多工位视觉检测系统设计与注塑件缺陷数据集构建塑料制…

作者头像 李华
网站建设 2026/5/1 5:46:20

基于深度学习的肺炎诊断模型

✨ 本团队擅长数据搜集与处理、建模仿真、程序设计、仿真代码、论文写作与指导,毕业论文、期刊论文经验交流。✅ 专业定制毕设、代码✅ 成品或定制,查看文章底部微信二维码(1)基于CT影像的细菌性、真菌性、病毒性肺炎分类诊断模型…

作者头像 李华
网站建设 2026/4/25 0:49:27

【开源分割视觉大模型】Semantic-SAM介绍

GitHub 开源仓库:UX-Decoder/Semantic-SAM https://github.com/UX-Decoder/Semantic-SAM Semantic-SAM 是什么 Semantic-SAM 是一类面向“通用分割”的视觉大模型,核心诉求不是只把区域抠出来,而是让分割结果具备更强的语义理解能力&#…

作者头像 李华
网站建设 2026/5/1 6:51:36

微信小程序毕设项目推荐-基于微信小程序的乐器商城宣传平台基于springboot+微信小程序的乐器宣传平台【附源码+文档,调试定制服务】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华