Java编码算法与哈希算法如何使用

   2023-02-09 学习力0
核心提示:本篇内容主要讲解“Java编码算法与哈希算法如何使用”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Java编码算法与哈希算法如何使用”吧!一、编码算法1.什么是编码ASCII 码就是一种编码,字母 A 的编码是十六

本篇内容主要讲解“Java编码算法与哈希算法如何使用”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Java编码算法与哈希算法如何使用”吧!

    一、编码算法

    1.什么是编码

    ASCII 码就是一种编码,字母 A 的编码是十六进制的 0x41 ,字母 B 是 0x42 ,以此类推。

    因为 ASCII 编码最多只能有 127 个字符,要想对更多的文字进行编码,就需要用占用 2个字节的 Unicode 。而中文的"中"字使用 Unicode 编码就是 0x4e2d ,使用 UTF8 则需要 3 个字节编码;因此,最简单的编码是直接给每个字符指定一个若干字节表示的整数,复杂一点的 编码就需要根据一个已有的编码推算出来。比如 UTF-8 编码,它是一种不定长编码, 但可以从给定字符的 Unicode 编码推算出来。

    2.URL编码

    URL 编码是浏览器发送数据给服务器时使用的编码,它通常附加在 URL 的参数部 分,例如: https://www.baidu.com/s?wd=%E4%B8%AD%E6%96%87

    之所以需要 URL 编码,是因为出于兼容性考虑,很多服务器只识别 ASCII 字符。 但如果 URL 中包含中文、日文这些非 ASCII 字符怎么办?不要紧, URL 编码有一套 规则:

    • 如果字符是 A ~ Z , a ~ z , 0 ~ 9 以及 - 、 _ 、 . 、 * ,则保持不变;

    • 如果是其他字符,先转换为 UTF-8 编码,然后对每个字节以 %XX 表示。

    例如:字符"中"的 UTF-8 编码是 0xe4b8ad ,因此,它的 URL 编码 是 %E4%B8%AD 。 URL 编码总是大写。

    Java 标准库提供了一个 URLEncoder 类来对任意字符串进行 URL 编码:

    import java.net.URLEncoder;
    public class Main {
        public static void main(String[] args) {
            String encoded = URLEncoder.encode("中文!", "utf-8");
    		System.out.println(encoded);
        }
    }

    上述代码的运行结果是 %E4%B8%AD%E6%96%87%21 ,"中"的 URL 编码 是 %E4%B8%AD ,"文"的URL编码是 %E6%96%87 , ! 虽然是 ASCII 字符,也要对其编 码为 %21 。

    如果服务器收到 URL 编码的字符串,就可以对其进行解码,还原成原始字符串。 Java 标准库的 URLDecoder 就可以解码:

    public class Main {
        public static void main(String[] args) {
            String decoded = URLDecoder.decode("%E4%B8%AD%E6%96%87%21", "utf-8");
    		System.out.println(decoded);
        }
    }

    特别注意: URL 编码是编码算法,不是加密算法。 URL 编码的目的是把任意文本数据编码为 % 前缀 表示的文本,编码后的文本仅包含 A ~ Z , a ~ z , 0 ~ 9 , - , _ , . , * 和 % ,便于浏览 器和服务器处理。

    3.Base64编码

    URL 编码是对字符进行编码,表示成 %xx 的形式,而 Base64 编码是对二进制数 据进行编码,表示成文本格式。

    Base64 编码可以把任意长度的二进制数据变为纯文本,并且纯文本内容中且只包 含指定字符内容: A ~ Z 、 a ~ z 、 0 ~ 9 、 + 、 / 、 = 。它的原理是把 3 字 节的二进制数据按 6bit 一组,用 4 个int整数表示,然后查表,把 int 整数用索引对 应到字符,得到编码后的字符串。

    6 位整数的范围总是 0 ~ 63 ,所以,能用 64 个字符表示:字符 A ~ Z 对应索 引 0 ~ 25 ,字符 a ~ z 对应索引 26 ~ 51 ,字符 0 ~ 9 对应索引 52 ~ 61 ,最 后两个索引 62 、 63 分别用字符 + 和 / 表示。

    举个例子: 3 个 byte 数据分别是 e4 、 b8 、 ad ,按 6bit 分组得到 39 、 0b 、 22 和 2d :

    ┌───────────────┬───────────────┬───────────────┐
    │      e4       │      b8       │      ad       │
    └───────────────┴───────────────┴───────────────┘
    ┌─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┐
    │1│1│1│0│0│1│0│0│1│0│1│1│1│0│0│0│1│0│1│0│1│1│0│1│
    └─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┘
    ┌───────────┬───────────┬───────────┬───────────┐
    │    39     │    0b     │    22     │    2d     │
    └───────────┴───────────┴───────────┴───────────┘

    在 Java 中,二进制数据就是 byte[] 数组。 Java 标准库提供了 Base64 来对 byte[] 数组进行编解码:

    public class Main {
        public static void main(String[] args) {
            byte[] input = new byte[] { (byte) 0xe4, (byte) 0xb8, (byte) 0xad };
            String b64encoded = Base64.getEncoder().encodeToString(input);
            System.out.println(b64encoded);
        }
    }

    编码后得到字符串结果: 5Lit4 。要对这个字符使用 Base64 解码,仍然用 Base64 这个类:

    public class Main {
        public static void main(String[] args) {
            byte[] output = Base64.getDecoder().decode("5Lit");
            System.out.println(Arrays.toString(output)); // [-28, -72, -83]
        }
    }

    因为标准的 Base64 编码会出现 + 、 / 和 = ,所以不适合把 Base64 编码后的字符串放到 URL 中。 一种针对 URL 的 Base64 编码可以在 URL 中使用的 Base64 编码,它仅仅是把 + 变成 - , / 变成 _ :

    public class Main {
        public static void main(String[] args) {
            // 原始字节内容
    		byte[] input = new byte[] { 0x01, 0x02, 0x7f, 0x00 };
    		// 分别使用两种方式进行编码
    		String b64Encode = Base64.getEncoder().encodeToString(input);
            String b64UrlEncoded = Base64.getUrlEncoder().encodeToString(input);
            // 结果完全一致
            System.out.println(b64Encode); 
            System.out.println(b64UrlEncoded);
            // 分别使用两种方式进行重新解码
            byte[] output1 = Base64.getDecoder().decode(b64Encode);
            System.out.println(Arrays.toString(output1));
            byte[] output2 = Base64.getUrlDecoder().decode(b64UrlEncoded);
            System.out.println(Arrays.toString(output2));
        }
    }
    • Base64 编码的目的是把二进制数据变成文本格式,这样在很多文本中就可以处理二进 制数据。例如,电子邮件协议就是文本协议,如果要在电子邮件中添加一个二进制文 件,就可以用 Base64 编码,然后以文本的形式传送。

    • Base64 编码的缺点是传输效率会降低,因为它把原始数据的长度增加了1/3。和 URL 编码一样, Base64 编码是一种编码算法,不是加密算法。

    • 如果把 Base64 的 64 个字符编码表换成 32 个、 48 个或者 58 个,就可以使 用 Base32 编码, Base48 编码和 Base58 编码。字符越少,编码的效率就会越低。

    二、哈希算法

    1.概述

    哈希算法( Hash )又称摘要算法( Digest ),它的作用是:对任意一组输入数 据进行计算,得到一个固定长度的输出摘要。哈希算法的目的:为了验证原始数据是否被篡改。

    哈希算法最重要的特点就是:

    • 相同的输入一定得到相同的输出;

    • 不同的输入大概率得到不同的输出。

    Java字符串的 hashCode() 就是一个哈希算法,它的输入是任意字符串,输出是固定 的 4 字节 int 整数:

    "hello".hashCode(); // 0x5e918d2
    "hello, java".hashCode(); // 0x7a9d88e8
    "hello, bob".hashCode(); // 0xa0dbae2f

    两个相同的字符串永远会计算出相同的 hashCode ,否则基于 hashCode 定位的 HashMap 就无法正常工 作。这也是为什么当我们自定义一个 class 时,覆写 equals() 方法时我们必须正确覆写 hashCode() 方法。

    2.哈希碰撞

    哈希碰撞是指,两个不同的输入得到了相同的输出:

    "AaAaAa".hashCode(); // 0x7460e8c0
    "BBAaBB".hashCode(); // 0x7460e8c0
    "通话".hashCode(); // 0x11ff03
    "重地".hashCode(); // 0x11ff03

    碰撞能不能避免?答案是不能。碰撞是一定会出现的,因为输出的字节长度是固定的, String 的 hashCode() 输出是 4 字节整数,最多只有 4294967296 种输出,但输入的数据长度是不固定的,有无数种输入。所以,哈希算 法是把一个无限的输入集合映射到一个有限的输出集合,必然会产生碰撞。

    碰撞不可怕,我们担心的不是碰撞,而是碰撞的概率,因为碰撞概率的高低关系到哈希算法的安全性。一个安全的哈希算法必须满足:

    • 碰撞概率低;

    • 不能猜测输出:输入的任意一个 bit 的变化会造成输出完全不同,这样就很难从输出反推输入(只能依靠 暴力穷举)。

    假设一种哈希算法有如下规律:

    hashA("java001") = "123456"
    hashA("java002") = "123457"
    hashA("java003") = "123458"

    那么很容易从输出 123459 反推输入,这种哈希算法就不安全。安全的哈希算法从输出是看不出任何规律的:

    hashB("java001") = "123456"
    hashB("java002") = "580271"
    hashB("java003") = ???

    3.常用哈希算法

    常用的哈希算法有:根据碰撞概率,哈希算法的输出长度越长,就越难产生碰撞,也就越安全。

    Java编码算法与哈希算法如何使用

    ①.MD5
    import java.security.MessageDigest;
    public class main {
    	public static void main(String[] args)  {
    		// 创建一个MessageDigest实例:
            MessageDigest md = MessageDigest.getInstance("MD5");
            // 反复调用update输入数据:
            md.update("Hello".getBytes("UTF-8"));
            md.update("World".getBytes("UTF-8"));
            // 16 bytes: 68e109f0f40ca72a15e05cc22786f8e6
            byte[] results = md.digest(); 
            StringBuilder sb = new StringBuilder();
            for(byte bite : results) {
            	sb.append(String.format("%02x", bite));
            }
            System.out.println(sb.toString());
    	}
    }

    运行上述代码,可以得到输入HelloWorld 的 MD5 是 68e109f0f40ca72a15e05cc22786f8e6

    使用 MessageDigest 时,我们首先根据哈希算法获取一个 MessageDigest 实例,然后, 反复调用 update(byte[]) 输入数据。当输入结束后,调用 digest() 方法获得 byte [] 数组表示的摘要,最后,把它转换为十六进制的字符串。

    ②.SHA-1
    import java.security.MessageDigest;
    public class main {
    	public static void main(String[] args)  {
    		// 创建一个MessageDigest实例:
            MessageDigest md = MessageDigest.getInstance("SHA-1");
            // 反复调用update输入数据:
            md.update("Hello".getBytes("UTF-8"));
            md.update("World".getBytes("UTF-8"));
            // 20 bytes: db8ac1c259eb89d4a131b253bacfca5f319d54f2
            byte[] results = md.digest(); 
            StringBuilder sb = new StringBuilder();
            for(byte bite : results) {
            	sb.append(String.format("%02x", bite));
            }
            System.out.println(sb.toString());
    	}
    }

    类似的,计算 SHA-256 ,我们需要传入名称" SHA-256 ",计算 SHA-512 ,我们需要传入名称" SHA-512 "。

    ③.RipeMD-160

    BouncyCastle是一个提供了很多哈希算法和加密算法的第三方开源库。它提供了 Java 标准库没 有的一些算法,例如, RipeMD160 哈希算法。 RIPEMD160 是一种基于 Merkle-Damgård 结构的加密哈希函数,它是比特币标准之一。 RIPEMD-160 是 RIPEMD 算法的增强版本, RIPEMD-160 算法可以产生出 160 位的的哈希摘要。

    用法:

    • 首先,我们必须把 BouncyCastle 提供的 bcprov-jdk15on-1.70.jar 添加至 classpath 。

    • 其次,Java标准库的 java.security 包提供了一种标准机制,允许第三方提供商无缝接入。我们要使用 Bouncy Castle 提供的 RipeMD160 算法,需要先把 BouncyCastle 注册一下:

    public class Main {
        public static void main(String[] args) throws Exception {
            // 注册BouncyCastle提供的通知类对象BouncyCastleProvider
            Security.addProvider(new BouncyCastleProvider());
            // 获取RipeMD160算法的"消息摘要对象"(加密对象)
            MessageDigest md = MessageDigest.getInstance("RipeMD160");
            // 更新原始数据
            md.update("HelloWorld".getBytes());
            // 获取消息摘要(加密)
            byte[] result = md.digest();
            // 消息摘要的字节长度和内容
            System.out.println(result.length); // 160位=20字节
            System.out.println(Arrays.toString(result));
            // 16进制内容字符串
            String hex = new BigInteger(1,result).toString(16);
            System.out.println(hex.length()); // 20字节=40个字符
            System.out.println(hex);
        }
    }

    4.哈希算法的用途

    校验下载文件

    因为相同的输入永远会得到相同的输出,因此,如果输入被修改了,得到的输出就会不同。

    如何判断下载到本地的软件是原始的、未经篡改的文件?我们只需要自己计算一下本地文件的哈希值,再 与官网公开的哈希值对比,如果相同,说明文件下载正确,否则,说明文件已被篡改。

    存储用户密码

    如果直接将用户的原始口令存放到数据库中,会产生极大的安全风险: 数据库管理员能够看到用户明文口令; 数据库数据一旦泄漏,黑客即可获取用户明文口令。

    到此,相信大家对“Java编码算法与哈希算法如何使用”有了更深的了解,不妨来实际操作一番吧!这里是***网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!

     
    标签: java
    反对 0举报 0 评论 0
     

    免责声明:本文仅代表作者个人观点,与乐学笔记(本网)无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
        本网站有部分内容均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,若因作品内容、知识产权、版权和其他问题,请及时提供相关证明等材料并与我们留言联系,本网站将在规定时间内给予删除等相关处理.

    • #新闻拍一拍# Oracle 调研如何避免让 Java 开发者投奔 Rust 和 Kotlin | Linux 中国
      #新闻拍一拍# Oracle 调研如何避免让 Java 开发
       导读:• 英特尔对迟迟不被 Linux 主线接受的 SGX Enclave 进行了第 38 次修订 • ARM 支持开源的 Panfrost Gallium3D 驱动本文字数:977,阅读时长大约:1分钟作者:硬核老王Oracle 调研如何避免让 Java 开发者投奔 Rust 和 KotlinOracle 委托分析公司 Omd
      03-08
    • oogle的“ JavaScript杀手” Dart 与JavaScript的比较
      oogle的“ JavaScript杀手” Dart 与JavaScript
      JavaScript通常被称为浏览器脚本语言,但它也已扩展到许多服务器端和移动应用程序开发环境。JS已经存在了将近20年,可以肯定地说它确实是一种成熟且稳定的编程语言。在Facebook发布React和React Native框架之后,JS变得越来越流行。JavaScript具有自己的软件
      03-08
    • sf02_选择排序算法Java Python rust 实现
      Java 实现package common;public class SimpleArithmetic {/** * 选择排序 * 输入整形数组:a[n] 【4、5、3、7】 * 1. 取数组编号为i(i属于[0 , n-2])的数组值 a[i],即第一重循环 * 2. 假定a[i]为数组a[k](k属于[i,n-1])中的最小值a[min],即执行初始化 min =i
      02-09
    • Delphi XE6 通过JavaScript API调用百度地图
      Delphi XE6 通过JavaScript API调用百度地图
      参考昨天的内容,有朋友还是问如何调用百度地图,也是,谁让咱都在国内呢,没办法,你懂的。 首先去申请个Key,然后看一下百度JavaScript的第一个例子:http://developer.baidu.com/map/jsdemo.htm下一步,就是把例子中的代码,移动TWebBrower中。 unit Unit
      02-09
    • JavaScript面向对象轻松入门之抽象(demo by ES5
      抽象的概念  狭义的抽象,也就是代码里的抽象,就是把一些相关联的业务逻辑分离成属性和方法(行为),这些属性和方法就可以构成一个对象。  这种抽象是为了把难以理解的代码归纳成与现实世界关联的概念,比如小狗这样一个对象:属性可以归纳出“毛色”、
      02-09
    • Java与Objective-C的渊源 objective-c和c++的区
      java创始成员Patrick Naughton回忆,通常人们会认为Java是学Modula-3和C+,其实这些都是谣传,而对Java影响比较大的则是Objective-C:单 继承、动态绑定和加载、类对象、纯虚函数、反射、原始类型包装类等。Java的接口直接抄自OC的协议。  Objective-C是扩
      02-09
    • Java项目导出数据为 PDF 文件的操作代码
      Java项目导出数据为 PDF 文件的操作代码
      目录Java项目如何导出数据为 PDF 文件?一、代码结构如下二、代码说明1、添加依赖 pom.xml2、HTML模板文件 audit_order_record.html3、添加字体4、PDF 导出工具类5、导出接口6、打开浏览器测试三、效果图Java项目如何导出数据为 PDF 文件?一个小需求,需要将
    • 盘点Java中延时任务的多种实现方式 java 延时队列怎么实现
      盘点Java中延时任务的多种实现方式 java 延时队
      目录场景描述实现方式一、挂起线程二、ScheduledExecutorService 延迟任务线程池三、DelayQueue(延时队列)四、Redis-为key指定超时时长,并监听失效key五、时间轮六、消息队列-延迟队列场景描述①需要实现一个定时发布系统通告的功能,如何实现? ②支付超时
    • Java Semaphore信号量使用分析讲解
      Java Semaphore信号量使用分析讲解
      目录前言介绍和使用API介绍基本使用原理介绍获取许可acquire()释放许可release()总结前言大家应该都用过synchronized 关键字加锁,用来保证某个时刻只允许一个线程运行。那么如果控制某个时刻允许指定数量的线程执行,有什么好的办法呢? 答案就是JUC提供的信
    • 【Java并发入门】03 互斥锁(上):解决原子性问题
      【Java并发入门】03 互斥锁(上):解决原子性
      原子性问题的源头是线程切换Q:如果禁用 CPU 线程切换是不是就解决这个问题了?A:单核 CPU 可行,但到了多核 CPU 的时候,有可能是不同的核在处理同一个变量,即便不切换线程,也有问题。所以,解决原子性的关键是「同一时刻只有一个线程处理该变量,也被称
      02-09
    点击排行