"파이썬 특정 단어 갯수 찾기"에 해당되는 글 - 1건

Post

파이썬 한글 글자수 체크 및 특정 단어 갯수 찾기

묘하게 파이썬 한글 글자수 체크하는 방법이 잘 안나온다.

쉬운거 같은데 기록을 안하는 느낌이다.

아무튼 아래는 파이썬 한글 글자수 체크 및 특정 단어 갯수 찾는 소스코드 예제.

흐름은 간단하다.

1) 파일을 연다
2) 파일을 단어 list for문으로 돌리면서 원하는 단어 갯수를 체크한다.

3) 텍스트의 갯수를 체크한다.

(다만 한글과 비교했을때 한글 글자수가 정확히 표시되지 않는다.

좀 적게 표시는되는 거 같아서 한 900자면 1200자 쓰고...

이렇게 어림짐작해야함)

4) 출력한다

import os
from collections import Counter
import re  # 정규 표현식 모듈을 import 해야 합니다

file_path = ''
file_name = 'text.txt'

search_word = ["단어1", "단어2"] # 크기 2개. 배열 아래랑 똑같이 맞춰야함
search_word_count = [0, 0] # 크기 2개. 배열 위랑 똑같이 맞춰야함
search_word_len = len(search_word) #range는 2면 0, 1만 돔

#파일 열고 단어 찾고 글자수 세기
def fileopen(data): 
    with open(file_path + file_name,'r',encoding='UTF8') as file:
        text = file.read()
        
        #단어 찾고 개수 카운팅
        for i in range(search_word_len) :
            print(search_word[i]+" count:"+str(text.count(search_word[i])))
            print("text11111:"+text)
            text.count(search_word[i])
            search_word_count[i] += text.count(search_word[i])
        
        splitdata = text.split()
        
    file.close()
    
    #공백, 특수문자 제거하고 눈에 보이는 글자수를 체크
    #우가 2바이트, 앙이 3바이트 뭐 이렇게 된다고 함
    #korean_letters = re.findall(r'[가-힣]', text)
    #return splitdata, len(korean_letters)
    
    #공백, 특수문자 포함 글자수체크
    #정확하지 않음. 한글2020이랑 비교하면 다름. 1200자정도 쓰면 1000자 넘을 듯... 수정해야함
    return splitdata, len(text)
   
splitdata, count = fileopen(file_path + file_name)


print("******* result *******:")
print("글자수:"+str(count))

for i in range(search_word_len) :
    print(str(search_word[i]) + " count: " + str(search_word_count[i]))
▲ top