java写的分词小程序

   2023-02-09 学习力0
核心提示: 根据给出的正则式,构建分词程序,完成相应的分词任务,并返回所有单词以及单词类别。关键字- int |for| while | do | return | break | continue运算符-   + | - | * | / |==|| = |!= || =界符- , | ; | ( | ) | {|}标识符- letter (letter | digit)*整

 

根据给出的正则式,构建分词程序,完成相应的分词任务,并返回所有单词以及单词类别。

<关键字>-> int |for| while | do | return | break | continue

<运算符>->   + | - | * | / |==| < | <= |!= | > | >=

<界符>-> , | ; | ( | ) | {|}

<标识符>-> letter (letter | digit)*

<整型常数>-> digit digit*

<小数>-> digit digit* . digit digit*

 

程序说明(关键代码)

 

public void getFenCi() throws Exception {   

        BufferedReader br = new BufferedReader(new InputStreamReader(

                new FileInputStream(filePath)));

        //遍历每一行

        for (String line =br.readLine(); line != null; line = br.readLine()) {

          String[] s1 = line.trim().split(" ");//得到空格分开的字符串数组并且去掉首尾空格          

 for(int i=0;i<s1.length;i++){

 char[] CharArray= s1[i].toCharArray();

       for(char c : CharArray) {

      if(c >= 'a' && c <= 'z' || c >= 'A' && c <= 'Z') {//字母

                if (match_4 == 1) {//之前是运算符

                    matchEqual_4();//str设置为运算符

                }

                if (match_3 == 1) {//之前是整数

                    matchEqual_3();

                }

                str1 = str1 + c;

                match_1 = 1;

            } else if (match_4(c + "")) {//分隔符

                if(match_1 == 1){

                    matchEqual_1();

                }

                if (match_4 == 1) {

                    matchEqual_4();

                }

                if (match_3 == 1) {

                    matchEqual_3();

                }

                str1 = "";

                str1 = str1 + c;

                setValue("5", str1);

                str1 = "";

            } else if (match_2(c + "")) {//标识符

                if(match_1 == 1){

                    matchEqual_1();

                }

                if (match_3 == 1) {

                    matchEqual_3();

                }

                str1 = str1 + c;

                match_4 = 1;

            } else if (match_3(c + "")) {//数字匹配

                if(match_1==1){

                    matchEqual_1();

                }

                if (match_4 == 1) {

                    matchEqual_4();

                }

                str1 = str1 + c;

                match_3 = 1;

            }

}

    }

        }

        br.close();

}

 

思路总结

 

1程序主要利用str存储每一个分词,根据当前字符和前一个分词判断出是继续添加字符进分词,还是结束添加,并判断出分词类型,存储。最后通过map存储分词和类型。

2正则式只是实现一部分,但是小数都没有实现,离真正分词程序有很大不同。

3空格是默认的分隔符,每一行也应该是分隔的。因此用readline方法。并且通过line.trim().split(" ")得到空格分开的字符串数组并且去掉首尾空格。     

 

 
反对 0举报 0 评论 0
 

免责声明:本文仅代表作者个人观点,与乐学笔记(本网)无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
    本网站有部分内容均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,若因作品内容、知识产权、版权和其他问题,请及时提供相关证明等材料并与我们留言联系,本网站将在规定时间内给予删除等相关处理.

  • 小程序上传wx.uploadFile - 小程序请假-请求
    小程序上传wx.uploadFile - 小程序请假-请求
    小程序上传wx.uploadFileUploadTask wx.uploadFile(Object object)将本地资源上传到服务器。客户端发起一个 HTTPS POST 请求,其中 content-type 为 multipart/form-data。使用前请注意阅读相关说明。num=1;当num==3时,设置按钮隐藏直接上代码:view class='
    03-08
  • 微信小程序中overflow:scroll失效的问题 微信小程序overflow设置滚动
    微信小程序中overflow:scroll失效的问题 微信小
    .common-pop-table {padding: 0 30rpx;overflow: scroll;max-height: 70%;}研究后发现,要实际的设置对应的那个维度的高度,wcss改成.common-pop-table {padding: 0 30rpx;overflow: scroll;max-height: 400px;}就恢复正常了
    03-08
  • 小程序 AI/AR 能力
    一、关于 VisionKit1、定义VisionKit 为小程序提供了开发 AR 功能的能力,包含了 AR 在内的视觉算法。2、版本提供了 V1 和 V2 两个版本,区别如下:V1平面接口,适用于用户在平面场景下,例如桌面,地面,泛平面场景,放置虚拟物体,不提供真实世界距离。用户
    03-08
  • Python小程序——快排算法 快排 python
    1 def Partition(list,p,q): 2 #这里是用来分块的算法。 3 x = list[p] 4 i = p 5 for j in range(p+1,q+1): #注意range是顾前不顾后的,所以后面的区间值要大一位 6 if list[j]x: 7 i+=1 8 list[i],list[j] = list[j],list[i] 9 10 list[p], list[i] = list[
    02-09
  • 总结一些 egret项目接小程序时 遇到的问题及解决方法
    总结一些 egret项目接小程序时 遇到的问题及解
    1,https://blog.csdn.net/u013052238/article/details/81456908  这个地址的一些问题 是一部分,其中 第6条,当在wxgame.ts中仿照已有的 暴露库给window的方法写完之后,仍会报错,本人遇到的是 : jszip is not defined :  也尝试过其他前辈分享的解决方
    02-09
  • c++第一个小程序 第一个小程序是什么
     #include iostreamusing namespace std;int main(){const int SIZE=50;//定义大小。char name[SIZE]; cout"please input you name!\n"; //提示cinname;//输入cout"hello world:"nameendl; //输出return 0;}   #include iostreamusing namespace std;int m
    02-09
  • 微信小程序 错误记录
    1、报错this.getUserInfo(this.setData) is not a function;at pages/index/index onShow function;at api request success callback functionTypeError: this.getUserInfo is not a function在回调结果里调用这个页面的函数 this.fun() 或者 this.setData 时
    02-09
  • 【小程序】添加tabBar后navigateTo失效
    某页面.js//事件处理函数bindViewTap() {wx.navigateTo({url: '../logs/logs',})}, app.json"tabBar": {"backgroundColor": "black","color":"white","list": [{"pagePath": "pages/index/inde
    02-09
  • 微信小程序npm引入vant-weapp库的方法
    微信小程序npm引入vant-weapp库的方法
    1、终端打开小程序所在目录  2、npm init初始化,初始化完成之后,小程序项目中就会出现package.json文件,说明已经初始化成功 3、npm install --production 安装生产环境,不要npm install都给装上,以免小程序包过大  4、安装vant :npm i vant-weapp
    02-09
  • 小程序组件之间的通信 小程序子父子组件通信
    前言:其实之前就想写这个的,因为我觉得这么模块化的框架,组件之间通信是非常重要的,也是最经常用到的一块儿,只是之前在项目里一直没用到跨组件通信,现在用到了,也会用了,就一起写出来得了 :) 一、父、子组件之间的通信注:首先我们先将子组件在父组
    02-09
点击排行