news 2026/5/26 18:43:12

Java 字符集 ASCII ISO-8859-1 GBK UTF8 Unicode

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Java 字符集 ASCII ISO-8859-1 GBK UTF8 Unicode

Java 字符集 ASCII ISO-8859-1 GBK UTF8 Unicode

ASCII

  • 用来表示英文字母、数字、标点符号,一个字符占 1 个字节。

ISO-8859-1

  • 欧洲国家语言使用的字符集,一个字符占 1 个字节。

GBK

  • 用来表示简体中文、繁体中文、英文字母、数字、标点符号。
  • 其中汉字占 2 个字节,中文标点符号占 2 个字节。
  • 英文字母、数字、英文标点符号占 1 个字节。

UTF8

  • 用来表示常见国家的语言
  • 使用 1 到 4 个字节表示字符
  • 其中汉字占 3 个字节,中文标点符号占 2 个字节。
  • 英文字母、数字、英文标点符号占 1 个字节。

Unicode

  • 内存中使用的字符集,也称万国码,一个字符占两个字节。
  • ASCII ISO-8859-1 GBK UTF8 是把数据写入文件时使用的字符集。

为什么 Unicode 可以用两个字节标识汉字,UTF8 却用三个字节


版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/26 18:42:53

ollama升级后局域网无法访问的解决过程

一、ollama升级到最新版本后通过局域网IP无法外部访问,但是127.0.0.1:11434访问正常这样会影响dify或者ragflow的外部调用二、Ollama默认可能仅绑定到 127.0.0.1(本地回环地址)导致外部无法访问。需确认其是否监听所有网络接口(0.…

作者头像 李华
网站建设 2026/5/26 18:42:09

基于STM32WL55JC与LoRaWAN的风力发电机远程监控系统设计与实现

1. 项目概述与核心思路风力发电机通常部署在远离城市的偏远地区,比如山顶、海岸线或广阔的平原。这种地理位置的特性,使得对它们的实时状态监控变得异常困难。想象一下,你需要定期派人驱车数小时,爬上几十米高的塔筒,只…

作者头像 李华
网站建设 2026/5/26 18:39:29

独立开发者如何从零构建轻量级SDK:架构设计与增长实战

1. 从零到一:一个草根SDK的诞生与挑战那天晚上,我盯着屏幕上竞争对手刚刚宣布的又一轮巨额融资新闻,心里五味杂陈。八千万美金,这个数字像一座山,横亘在我这个只有一行行代码和一个想法的独立开发者面前。我的“竞争对…

作者头像 李华
网站建设 2026/5/26 18:39:27

别再重启失败!Linux服务器快速重启时setsockopt端口复用避坑指南

Linux服务器快速重启时setsockopt端口复用实战指南凌晨三点,服务器突然崩溃告警。当你尝试快速重启服务时,却遭遇了"Address already in use"的致命错误——这是每个运维工程师都经历过的噩梦时刻。端口被占用导致的启动失败不仅影响服务可用性…

作者头像 李华