【更新】对不起大家qwq之前的正则表达式提取汉字和删人名的部分有点问题!!!现在已经修复过来了!!!口语语料库总有效字数10***62字!中国人说的“是”字最多。
不是“的”也不是“了”。
“的”仅仅排第三,“了”字甚至没有进前十。
这个问题不能直接照搬现有的字频数据啦。
既然题主问的是“中国人 说哪个字最多”,那么我们不能统计书面语语料,必须统计口语语料,甚至使用聊天记录都会有一定的偏差,因为我们打下的字不一定…。
以色列为什么突然敢打伊朗了?不怕被报复?
性在婚姻生活中真的重要吗?
如何看待多地开展查摆年轻干部玩心重、混日子、说话随意、口大气粗等问题的行动?
cloudflare的1.1.1.1和warp有什么区别?
Rust的设计缺陷是什么?
为什么各大 *** 出奇一致地设置了『摇一摇开屏广告』?如何关闭常用 *** 的这些广告?
SATA固态好用吗?为什么大家都喜欢m.2呢?
如何看待CCTV13批评“L2.999智驾”等误导性宣传,若导致事故车企可能需要担责?
中国大陆的苹果手机被阉割了哪些部分?
37岁女,离异带一女孩,好不好找?
电话:
座机:
邮箱:
地址: