Swift base64 解码非字母和非 utf-8 字符串

25-04-27 6

对于Swiftbase64解码非字母和非utf-8字符串感兴趣的读者，本文将提供您所需要的所有信息，并且为您提供关于'java.lang.NoClassDefFoundError由java.lang.

对于Swift base64 解码非字母和非 utf-8 字符串感兴趣的读者，本文将提供您所需要的所有信息，并且为您提供关于'java.lang.NoClassDefFoundError 由 java.lang.ClassNotFoundException 引起的 Ljava/util/Base64 解析失败未找到类“java.util.Base64”、ASCII、Unicode、utf-8、utf-16、utf-32、ASCII、Unicode、UTF-8、UTF-8（without BOM）、UTF-16、UTF-32傻傻分不清、Base64 - 在数据库中另存为 base64 并显示到前端而不创建文件但 BLOB 或？的宝贵知识。

本文目录一览：

Swift base64 解码非字母和非 utf-8 字符串
'java.lang.NoClassDefFoundError 由 java.lang.ClassNotFoundException 引起的 Ljava/util/Base64 解析失败未找到类“java.util.Base64”
ASCII、Unicode、utf-8、utf-16、utf-32
ASCII、Unicode、UTF-8、UTF-8（without BOM）、UTF-16、UTF-32傻傻分不清
Base64 - 在数据库中另存为 base64 并显示到前端而不创建文件但 BLOB 或？

Swift base64 解码非字母和非 utf-8 字符串

如何解决Swift base64 解码非字母和非 utf-8 字符串

是否可以使用包含非 utf8 编码字符串的 Swift 语言 base64 编码字符串（即 Windows-1252 或 ISO-8859-1）正确解码？

可以在 stackoverflow 上找到的每个代码片段都失败并返回 nil。

例如 let decodedData = NSData(base64EncodedString: base64String,options:NSDataBase64DecodingOptions.IgnoreUnkNownCharacters)

给出空，因为它忽略坏字符，如果我不使用这个选项，它会像许多其他 gist 代码一样给出 nil

这是包含我需要解码的部分加密密钥的测试 base64 字符串。如果我使用 Python、PHP 或 Java 等其他语言，它可以正确解码，但使用 Swift 则无法做到。

FkXKDAAAAAAAAAAAvMBAYFk1JADmiwHAz+rNFy93faklHL7MW3Hhlf1Bo7/hpZ3j1GmdySyIpJ4YlRH65mleumYqsgUgYLlQY/jQq2YykmpuwZQ4jTgU7Q== 应该是 EÊ¼À@`Y5$æ‹ÀÏêÍ/w}©%¾Ì[qá•ýA£¿á¥ãÔiÉ,ˆ¤ž•úæi^ºf*² `¹PcøÐ«f2ÃÔÁ”88í

因为它可以用这样的在线工具解码

这是另一个：

FgdhDAAAAAAABwAAOJAiYMxlJQAMbwHAWrYq59+po4WdMS4R+EHV4hBKzWn8oZYpTFdFQ33usZUa19d+umkWcL2g4mmVeUOwUG2dZGWIrxlTWJA+s/RTTQ==

请告知是否有任何方法可以在 iOS 设备上本地解码这样的 base64 字符串，或者我真的需要将其发送到服务器才能做到这一点？

解决方法

你正在寻找一个相当古老的例子。语法改为：

let decodedData = Data(base64Encoded: base64String)

我已经用您的示例进行了测试，它们运行良好。请记住，输出是原始数据，这不是任何编码（Windows-1252 或 ISO-8859-1 等）中的字符串。它只是一个随机字节序列，这就是它的预期。您使用的在线工具只是试图将其解码为 ISO-8859-1，但这是胡言乱语，实际上在您显示的输出中已损坏。它不显示第一个字节（0x16，不可打印）。

'java.lang.NoClassDefFoundError 由 java.lang.ClassNotFoundException 引起的 Ljava/util/Base64 解析失败未找到类“java.util.Base64”

如何解决''java.lang.NoClassDefFoundError 由 java.lang.ClassNotFoundException 引起的 Ljava/util/Base64 解析失败未找到类“java.util.Base64”？

我收到此错误，我已阅读该错误以解决它我必须将 import java.util.Base64 替换为 import android.util.Base64 但在我的整个项目中我只发现 Base68 result = Base64.getEncoder().encodetoString(macData); 的唯一用法我该如何解决？而且我不能用 android.util.Base.64 替换 java.util.Base64 因为这行代码在后端

解决方法

这很不幸 - 这意味着您正在使用某个库，而那个库正在尝试使用 /i。 Android 选择了 Java 库，就像 android 发布时一样，现在已经是很久以前的事了。从那以后它们就没有真正更新过。（那个 oracle v google 法庭案件可能没有帮助……）

java.util.Base64 已添加到 https://forge.autodesk.com/en/docs/design-automation/v3/reference/cmdLine/cmdLine-inventor/（有关此信息，请参阅 javadoc 中的“since”行；任何“1.6”或以下，或者如果没有“since”行，肯定可用在 android 上。其他东西通常不是）。 java 8 现在已经 7 岁了，因此不是专门为 android 设计的库越来越有可能开始使用这些非 android 库调用。

检查堆栈跟踪，您会找到正在执行此操作的库。恐怕除了停止使用这个库之外别无他法。您可以尝试在您的应用程序中粘贴 juBase64 impl，但这会相对棘手，因为这可能涉及一些法律问题，因此，要么没有人这样做，要么如果他们这样做，他们可能不会宣传如何。

您可以要求这个库使用第三方库来做 base64 工作，但他们可能不想这样做，这可能不是库无法在 android 上运行的唯一问题。

如果 android 变体是一个替代品，你可以重写这个库的类文件，但这也是一个有点笨拙、笨拙的概念，并不完全困难，但因为这不是一件正常的事情，而且通常积极不喜欢，我认为您无法轻松找到有关如何操作的文档。

因此，建议：尝试寻找另一个图书馆。

ASCII、Unicode、utf-8、utf-16、utf-32

理解ASCII、Unicode、utf-8、utf-16、utf-32

理解ASCII、Unicode、utf-8、utf-16、utf-32编码与解码字符集字符编码ASCIIUnicodeUTFUTF-32UTF-16UTF-8UTF-8的编码实现方法Emoji问题

编码与解码

在计算机中，信息是由 0和1组成的二进制进行传递的，将我们看到的字符转化为二进制数字的过程就是编码，反之将二进制数字转换为字符的过程是解码。

字符集

ASCII和Unicode分别是两种不同的编码方式，通过某一种编码方式进行编码所组成的集合称为字符集。如，字符通过Unicode编码所组成集合称为Unicode字符集。

字符编码

对于一个字符集来说要正确编码转码一个字符需要三个关键元素：字库表（character repertoire）、编码字符集（coded character set）、字符编码（character encoding form）。

字库表，决定了整个字符集能够展现表示的所有字符的范围。

编码字符集，即用一个编码值来表示一个字符在字库中的位置。如Unicode。

字符编码，将编码字符集和实际存储数值之间的转换关系。一般会将编码字符集的值作为编码后的值直接存储。如UTF-8。

看到这里，可能很多读者都会有和我当初一样的疑问：字库表和 编码字符集看来是必不可少的，那既然字库表中的每一个字符都有一个自己的序号，直接把序号作为存储内容就好了。为什么还要多此一举通过 字符编码把序号转换成另外一种存储格式呢？其实原因也比较容易理解：统一字库表的目的是为了能够涵盖世界上所有的字符，但实际使用过程中会发现真正用的上的字符相对整个字库表来说比例非常低。例如中文地区的程序几乎不会需要日语字符，而一些英语国家甚至简单的ASCII字库表就能满足基本需求。而如果把每个字符都用字库表中的序号来存储的话，每个字符就需要3个字节（这里以Unicode字库为例），这样对于原本用仅占一个字符的ASCII编码的英语地区国家显然是一个额外成本（存储体积是原来的三倍）。算的直接一些，同样一块硬盘，用ASCII可以存1500篇文章，而用3字节Unicode序号存储只能存500篇。于是就出现了UTF-8这样的变长编码。在UTF-8编码中原本只需要一个字节的ASCII字符，仍然只占一个字节。而像中文及日语这样的复杂字符就需要2个到3个字节来存储。

ASCII

由于计算机是美国人发明的，并没有考虑其他国家的字符，最早的编码方式便是ASCII。0 - 255被用来表示大小写英文字母、数字和一些符号，这个编码表被称为ASCII编码。

Unicode

Unicode编码定义了这个世界上几乎所有字符，而且Unicode还兼容了很多老版本的编码规范，例如刚刚讲过的 ASCII码。Unicode 编码发展到今天扩展到了 21 位。详见http://en.wikipedia.org/wiki/Unicode

Unicode也为了每个字符发了一张身份证，这张“身份证”上有一串唯一的数字ID确定了这个字符。这串数字在整个计算机的世界具有唯一性，Unicode给这串数字ID起了个名字叫码点。码点经过映射后得到的二进制串的转换格式单位称之为码元。码点就是一串二进制数，码元就是切分这个二进制数的方法。

Unicode的编号从 0000开始一直到 10FFFF共分为16个Plane，每个Plane中有65536个字符（正好填充2个字节，16位）。0 号平面叫做基本多文种平面（ BMP, Basic Multilingual Plane ），涵盖了几乎所有你能遇到的字符，除了 emoji（emoji位于1号平面），其它平面叫做补充平面，大多是空的。

UTF

Unicode转换格式（Unicode Transformation Formats，即UTF），是为了解决码点在计算机中存储方式而设计的。

UTF-32

UTF-32是最好理解的一个了。UTF-32也就是说它的码元是32位，每32位去读一下码点，而码点是Unicode给字符的编码，前面也说了，最长才21位，因此每一个 UTF-32 值都可以直接表示对应的码点。

UTF-16

UTF-16的码元是16位的，也就是说每16位去读一下码点，获取码点的前16位数字，直到读取完成。由于BMP 几乎包括了所有常见字符，UTF-16 一般需要 UTF-32大约一半的空间。至于其它平面里很少使用的码点都是用两个 16 位的码元来编码的。

UTF-8

UTF-8 使用一到四个字节来编码一个码点。从 0 到 127 的这些码点直接映射成 1 个字节（对于只包含这个范围字符的文本来说，这一点使得 UTF-8 和 ASCII 完全相同）。接下来的 1,920 个码点映射成 2 个字节，在 BMP 里所有剩下的码点需要 3 个字节。Unicode 的其他平面里的码点则需要 4 个字节。UTF-8 是基于 8 位的码元的。UTF-8 是基于 8 位的码元的，因此它并不需要关心字节顺序（因为字节就是8位的呀，其它UTF-16和UTF-32在不同的机器编译环境下需要考虑字节的顺序问题）

UTF-8的编码实现方法

UTF-8编码为变长编码。最小编码单位为一个字节。一个字节的前1-3个bit为描述性部分，后面为实际序号部分。

如果一个字节的第一位为0，那么代表当前字符为单字节字符，占用一个字节的空间。0之后的所有部分代表在Unicode中的序号。
如果一个字节以110开头，那么代表当前字符为双字节字符，占用2个字节的空间。110之后的所有部分代表在Unicode中的序号。且第二个字节以10开头
如果一个字节以1110开头，那么代表当前字符为三字节字符，占用3个字节的空间。110之后的所有部分代表在Unicode中的序号。且第二、第三个字节以10开头
如果一个字节以10开头，那么代表当前字节为多字节字符的第二个字节。10之后的所有部分代表在Unicode中的序号。

具体每个字节的特征可见下表，其中 x代表序号部分，把各个字节中的所有 x部分拼接在一起就组成了在Unicode字库中的序号

Byte1	Byte2	Byte3
0xxx xxxx
110x xxxx	10xx xxxx
1110 xxxx	10xx xxxx	10xx xxxx

可以得出这样一个规律：

3个字节的UTF-8十六进制编码一定是以 E开头的
2个字节的UTF-8十六进制编码一定是以 C或 D开头的
1个字节的UTF-8十六进制编码一定是以比 8小的数字开头的

Emoji问题

前面也提到Emoji位于1号平面，是需要四个字节来编码的，Emoji在Unicode中位于 \u1F601- \u1F64F区段。这个显然超过了目前常用的UTF-8字符集的编码范围 \u0000- \uFFFF。Emoji表情随着IOS的普及和微信的支持越来越常见。下面就是几个常见的Emoji:

那么Emoji字符表情会对我们平时的开发运维带来什么影响呢？最常见的问题就在于将他存入MySQL数据库的时候。一般来说MySQL数据库的默认字符集都会配置成UTF-8（三字节），而utf8mb4在5.5以后才被支持，也很少会有DBA主动将系统默认字符集改成utf8mb4。那么问题就来了，当我们把一个需要4字节UTF-8编码才能表示的字符存入数据库的时候就会报错：ERROR1366:Incorrectstringvalue:''\xF0\x9D\x8C\x86''forcolumn 。如果认真阅读了上面的解释，那么这个报错也就不难看懂了。我们试图将一串Bytes插入到一列中，而这串Bytes的第一个字节是 \xF0意味着这是一个四字节的UTF-8编码。但是当MySQL表和列字符集配置为UTF-8的时候是无法存储这样的字符的，所以报了错。

那么遇到这种情况我们如何解决呢？有两种方式：

升级MySQL到5.6或更高版本，并且将表字符集切换至utf8mb4。
第二种方法就是在把内容存入到数据库之前做一次过滤，将Emoji字符替换成一段特殊的文字编码，然后再存入数据库中。之后从数据库获取或者前端展示时再将这段特殊文字编码转换成Emoji显示。

ASCII、Unicode、UTF-8、UTF-8（without BOM）、UTF-16、UTF-32傻傻分不清

[TOC]

前言

Github上下载了一份代码打算学习，源工程是在linux上开发的，我在Windows上编译通过不了，很多莫名奇妙的错误，最后发现源代码文件是UTF-8（without BOM）编码的，Notepad++修改编码格式为UTF-8编译通过。

为什么Windows不认识UTF-8（without BOM）？
为什么Linux认识UTF-8（without BOM）和UTF-8？

ASCII

毕竟在电子系混过四年，这个词不陌生，用一个字节的低7位来表示128个英文字符（0xxxxxxx），可是地球上的文字又不是只有英文，光汉字就好几万个，所以每个国家和地区又做了一套符合自身情况的编码规范，比如简体中文编码标准GB2312，使用两个字节来表示一个汉字，可以表示65536个中文字符。但是如果每个国家都这么搞那不就乱套了嘛，于是Unicode就应运而生了。

Unicode

Unicode是个符号集，与ASCII类似，只不过容量要大得多，可以理解成一张表，为世界上的每一个字符指定了一个惟一的二进制代码，但是它并没有规定这个二进制代码如何存储，于是乎UTF-8、UTF-8（without bom）、UTF-16、UTF-32应运而生。

UTF

UTF（Unicode Transformation Format）意为把Unicode字符转换成某种格式，常见到的有：
UTF-8：使用1至4个字节为每个字符进行编码，节省空间。
UTF-16：使2或4个字节为每个字符编码，大多数汉字采用2个字节，少了生僻字使用4个字节，编码单元为2个字节，所以存在字节序的问题，即大端还是小端。（不常用）
UTF-32：使4个字节为每个字符编码，编码单元为4个字节，所以存在字节序的问题，即大端还是小端。（不常用）

UTF-8

UTF-8是Unicode的实现方式之一，最大特点就是根据符号自动变化字节长度，即可变长编码，编码方式如下图所示：

	Unicode符号范围				UTF-8编码
	 （十六进制）        		（二进制）
————————————————————————————————————————————————————————————
0000 0000 0000 007F	 	|	0xxxxxxx
0000 0080 0000 07FF	 	|	110xxxxx 10xxxxxx
0000 0800 0000 FFFF	 	|	1110xxxx 10xxxxxx 10xxxxxx
0001 0000 0010 FFFF	 	|	11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

对于单字节字符，第一位为0，后面7位位对应的Unicode码，显然UTF-8是兼容ASCII的，
对于n(n > 1)字节字符，第一个字节的前n位都设为1，第 n+1位设为0，后面的n-1个字节前两位一律设为10，其余的字节（图上的x）即为Unicode码。

UTF-8（without BOM）

BOM（Byte Order Mark）字节顺序标记，即可以用来标记是大端还是小端。在Unicode里面定义了一个叫做

”ZERO WITH NO-BREAK SPACE“的不可见字符，对应的Unicode编码是FEFF，有BOM的文件即文件开头有”ZERO WITH NO-BREAK SPACE“不可见字符，反之则没有。若是大端编码，则文件开头是FEFF，小端则是FFFE。BOM是为了配合UTF-16和UTF-32使用，因为它们编码编码单元包含多个字节，涉及字节序的问题。

UTF-8以单字节为编码单元，不存在字节序的问题，但是可以使用BOM来表明所使用的编码方式，字符”ZERO WITH NO-BREAK SPACE“在UTF-8中的编码是EF BB BF，所以当解码文件时发现开头的单个字节是EF BB BF即说明是UTF-8编码，Windows就是使用BOM来标记文本的编码方式的。

怎样区分UTF-8、UTF-16和UTF-32

打开文本时根据BOM来区分当前文件的编码类型

BOM							编码类型
——————————————————————————————————————
EF BB BF					UTF-8
FE FF						UTF-16(大端)
FF FE						UTF-16(小端)
00 00 FE FF					UTF-32(大端)
FF FE 00 00					UTF-32(小端)

Base64 - 在数据库中另存为 base64 并显示到前端而不创建文件但 BLOB 或？

如何解决Base64 - 在数据库中另存为 base64 并显示到前端而不创建文件但 BLOB 或？

注意：我在前端使用 Reactjs，在后端使用 Nodejs/express

首先，我有一个文件输入，我知道如何使用 FileReader() API 显示图像。

现在我在 Base64 中有这样的图像数据：data:image/jpeg;base64,/9j/4QAYRXhpZgAASUkqAAgAAAAAAAAAAAAAAP/sABFEdWNreQABAAQAAABQAA...

将其直接保存到 DB (MongoDB) 是否安全或最佳做法？

如何仅使用 Base64 数据从数据库中获取该图像（无需在节点中创建图像文件）后创建该图像的 url？

我的最终目标是获得这样的网址：www.example.com/4QAYRXhpZgAASUkq/ 而不在后端创建文件

示例：

// base64 from DB :
const data = data:image/jpeg;base64,/9j/4QAYRXhpZgAASUkq;
// Then method here
// Note this scenario should done in frontend
const makeUrl (data) => {...}
// Then the image Now have full url like
// makeUrl(data) => result  will
 www.example.com/image-from-base64.jpg // or
 www.example.com/4QAYRXhpZgAASUkq/

解决方法

Base64 在数据库中存储图像从来都不是一个好主意，因为它需要多 30% 的空间。考虑使用二进制字符串。还要避免将图像存储在数据库中，并考虑使用 Amazon S3 等替代方案。

要使用Base64图像，只需将链接的href设置为Base64数据

<a href = "Base64data">example.com/image</a>

如果使用 Javascript 使用 -

document.getElementById(''link-id'').href = ''base-64 data'';

今天关于Swift base64 解码非字母和非 utf-8 字符串的分享就到这里，希望大家有所收获，若想了解更多关于'java.lang.NoClassDefFoundError 由 java.lang.ClassNotFoundException 引起的 Ljava/util/Base64 解析失败未找到类“java.util.Base64”、ASCII、Unicode、utf-8、utf-16、utf-32、ASCII、Unicode、UTF-8、UTF-8（without BOM）、UTF-16、UTF-32傻傻分不清、Base64 - 在数据库中另存为 base64 并显示到前端而不创建文件但 BLOB 或？等相关知识，可以在本站进行查询。

本文标签：