"파이썬 특정 단어 갯수 찾기"에 해당되는 글 - 1건
Post
파이썬 한글 글자수 체크 및 특정 단어 갯수 찾기
묘하게 파이썬 한글 글자수 체크하는 방법이 잘 안나온다.
쉬운거 같은데 기록을 안하는 느낌이다.
아무튼 아래는 파이썬 한글 글자수 체크 및 특정 단어 갯수 찾는 소스코드 예제.
흐름은 간단하다.
1) 파일을 연다
2) 파일을 단어 list for문으로 돌리면서 원하는 단어 갯수를 체크한다.
3) 텍스트의 갯수를 체크한다.
(다만 한글과 비교했을때 한글 글자수가 정확히 표시되지 않는다.
좀 적게 표시는되는 거 같아서 한 900자면 1200자 쓰고...
이렇게 어림짐작해야함)
4) 출력한다
import os
from collections import Counter
import re # 정규 표현식 모듈을 import 해야 합니다
file_path = ''
file_name = 'text.txt'
search_word = ["단어1", "단어2"] # 크기 2개. 배열 아래랑 똑같이 맞춰야함
search_word_count = [0, 0] # 크기 2개. 배열 위랑 똑같이 맞춰야함
search_word_len = len(search_word) #range는 2면 0, 1만 돔
#파일 열고 단어 찾고 글자수 세기
def fileopen(data):
with open(file_path + file_name,'r',encoding='UTF8') as file:
text = file.read()
#단어 찾고 개수 카운팅
for i in range(search_word_len) :
print(search_word[i]+" count:"+str(text.count(search_word[i])))
print("text11111:"+text)
text.count(search_word[i])
search_word_count[i] += text.count(search_word[i])
splitdata = text.split()
file.close()
#공백, 특수문자 제거하고 눈에 보이는 글자수를 체크
#우가 2바이트, 앙이 3바이트 뭐 이렇게 된다고 함
#korean_letters = re.findall(r'[가-힣]', text)
#return splitdata, len(korean_letters)
#공백, 특수문자 포함 글자수체크
#정확하지 않음. 한글2020이랑 비교하면 다름. 1200자정도 쓰면 1000자 넘을 듯... 수정해야함
return splitdata, len(text)
splitdata, count = fileopen(file_path + file_name)
print("******* result *******:")
print("글자수:"+str(count))
for i in range(search_word_len) :
print(str(search_word[i]) + " count: " + str(search_word_count[i]))
'이전게시판 > Python' 카테고리의 다른 글
python 폴더 내 파일 이름 변경 rename (0) | 2025.03.30 |
---|---|
inconsistent use of tabs and spaces in indentation in Python (0) | 2024.04.18 |
ModuleNotFoundError: No module named 'pandas' 아나콘다가 깔려 있을 때 해결법 (0) | 2024.01.27 |
Python 크롤링 리스트 출력 (0) | 2023.04.10 |