• 大小: 299KB
    文件类型: .zip
    金币: 2
    下载: 1 次
    发布日期: 2021-12-03
  • 语言: C#
  • 标签: C#  词频统计  

资源简介

用C#实现了英文文章的词频统计,界面通俗易懂,便于交互,文档为txt格式!

资源截图

代码片段和文件信息

using System;
using System.Collections.Generic;
using System.ComponentModel;
using System.Data;
using System.Drawing;
using System.Linq;
using System.Text;
using System.Windows.Forms;
using System.IO;
using System.Text.Regularexpressions;


namespace 词频统计
{
    public partial class Form1 : Form
    {
        public Form1()
        {
            InitializeComponent();
        }

        String sb =““;        
        List sList = new List();
        int count = 0;
        
        private void button1_Click(object sender EventArgs e)
        {
            label1.Text = “0“;
            count = 0;
            sb = ““;
            sList.Clear();
            listBox1.Items.Clear();

            OpenFileDialog myFile = new OpenFileDialog();
            DialogResult fileResult = myFile.ShowDialog();
            if(fileResult==DialogResult.OK)
            {
                StreamReader mySR = new StreamReader(myFile.FileName Encoding.Default);
                textBox1.Text = mySR.ReadToEnd();
                sb = textBox1.Text;

                sb = sb.Replace(Environment.NewLine “ “);
                sb = sb.Replace(“\t“ “ “);
                sb = sb.Replace(““ “ “);
                sb = sb.Replace(“.“ “ “);
                sb = sb.Replace(“(“ “ “);
                sb = sb.Replace(“)“ “ “);
                sb = Regex.Replace(sb @“\s+“ “ “);
               
                String[] slist = sb.Split(‘ ‘);
                foreach (String s in slist)
                {
                    sList.Add(s);
                }
                String[] squchong = slist.Distinct().ToArray();
                foreach (string s in squchong)
                {
                    listBox1.Items.Add(s);
                }
                listBox1.SelectedIndex = 0;
                textBox2.Text = listBox1.Text;
                CiPin();
            }
        }

        private void textBox2_TextChanged(object sender EventArgs e)
        {
            CiPin();
        }

        private void listBox1_SelectedIndexChanged_1(object sender EventArgs e)
        {
            textBox2.Text = listBox1.Text;
            CiPin();
        }   
       
        public void CiPin()
        {
            count = 0;
            foreach (String s in sList)
            {
                if (s.Equals(textBox2.Text))
                {
                    count++;
                }
            }
            label1.Text = count.ToString();
        } 
    }
}

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     目录           0  2017-11-15 10:12  词频统计\
     目录           0  2017-11-15 10:12  词频统计\.vs\
     目录           0  2017-11-15 10:12  词频统计\.vs\词频统计\
     目录           0  2017-11-15 10:13  词频统计\.vs\词频统计\v14\
     文件       24064  2017-11-15 10:13  词频统计\.vs\词频统计\v14\.suo
     文件      803592  2017-11-15 09:38  词频统计\lemmas.txt
     目录           0  2017-11-15 09:38  词频统计\词频统计\
     文件         878  2017-11-15 09:38  词频统计\词频统计.sln
     文件        2664  2017-11-15 09:38  词频统计\词频统计.txt
     目录           0  2017-11-15 09:38  词频统计\词频统计\bin\
     目录           0  2017-11-15 09:38  词频统计\词频统计\bin\Debug\
     文件       11776  2017-11-15 10:12  词频统计\词频统计\bin\Debug\词频统计.exe
     文件       22016  2017-11-15 10:12  词频统计\词频统计\bin\Debug\词频统计.pdb
     文件       22696  2017-11-15 10:13  词频统计\词频统计\bin\Debug\词频统计.vshost.exe
     文件         490  2013-06-18 20:28  词频统计\词频统计\bin\Debug\词频统计.vshost.exe.manifest
     文件        2584  2017-11-15 09:38  词频统计\词频统计\Form1.cs
     文件        6544  2017-11-15 09:38  词频统计\词频统计\Form1.Designer.cs
     文件        5817  2017-11-15 09:38  词频统计\词频统计\Form1.resx
     目录           0  2017-11-15 09:38  词频统计\词频统计\obj\
     目录           0  2017-11-15 09:38  词频统计\词频统计\obj\x86\
     目录           0  2017-11-15 10:12  词频统计\词频统计\obj\x86\Debug\
     文件        5420  2017-11-15 09:38  词频统计\词频统计\obj\x86\Debug\DesignTimeResolveAssemblyReferences.cache
     文件        7101  2017-11-15 10:12  词频统计\词频统计\obj\x86\Debug\DesignTimeResolveAssemblyReferencesInput.cache
     文件         208  2017-11-15 09:38  词频统计\词频统计\obj\x86\Debug\GenerateResource.read.1.tlog
     文件         502  2017-11-15 09:38  词频统计\词频统计\obj\x86\Debug\GenerateResource.write.1.tlog
     目录           0  2017-11-15 09:38  词频统计\词频统计\obj\x86\Debug\TempPE\
     文件        1709  2017-11-15 10:13  词频统计\词频统计\obj\x86\Debug\词频统计.csproj.FileListAbsolute.txt
     文件        1012  2017-11-15 10:12  词频统计\词频统计\obj\x86\Debug\词频统计.csproj.GenerateResource.Cache
     文件        9177  2017-11-15 10:12  词频统计\词频统计\obj\x86\Debug\词频统计.csprojResolveAssemblyReference.cache
     文件       11776  2017-11-15 10:12  词频统计\词频统计\obj\x86\Debug\词频统计.exe
     文件         180  2017-11-15 09:38  词频统计\词频统计\obj\x86\Debug\词频统计.Form1.resources
............此处省略10个文件信息

评论

共有 条评论