웹 크롤링을 공부하고 있습니다. 학식pdf를 다운받고 제목으로 몇월 몇주차 학식이라고 저장을 할려 했는데 저장한 이름을 보니 5월 4주차가 아닌 무슨 이상한 기호로...
메모장 저장후 열기로 불러오면 그림처럼 깨집니다. 윈도우 11이고, 인코딩 UTF-8 형식으로 저장되어있습니다. 뭐가 문제일까요? 음.. 혹시 글꼴 한번 바꿔보시겠어요?
오류 내용은 다음과 같습니다. 환경은 우분투, 데이터는 tsv파일이며, 데이터에 mecab을 적용하고 , post_tokenize까지해서 진짜 띄어쓰기에는 _를 mecab의...
태그: 파이썬, NLP, BPE, unicodeerror, utf8
utf-8 로 저장하던 파일을 windows-1251(추정) 로 잘못저장했더니 ì—¥? ë„Œ ëëƒ? 이렇게 깨졌습니다... 이걸 다시 돌릴 수 있을까요?? 안 돌려도 되니 읽을 수만 있게...
<?php header('Content-Type: text/html; charset=UTF-8'); ?> 해도 계속 한글이 깨지네요. 혹시 어떤 부분이나 파일에서 수정해야 하는지 아시면 제발 살려주세요.. 또한...
인코딩 방식 둘 다 영어는 8bit 이고 다른 문자는 더 많은 bit를 이용하는데 왜 ANSI는 여러나라의 문자를 동시에 표현하지 못한다고 하고, UTF-8은 전세계 문자를...
안녕하세요. 한 3주쯤 전부터 네이버 카페에서 파일을 다운받을 때 UTF-8"이라는 말이 파일명에 붙어 나옵니다. 검색해보니 유니코드 관련된 거 같은데 ,, 제가 잘 몰라요.....
... 이 방법은 다음과 같습니다: 윈도우 메모장의 기본 텍스트 파일 형식을 ANSI에서 UTF8로 변경하기 (Encoding 변경) (tistory.com) 1. 바탕화면에서 마우스 오른쪽 버튼...
네이버 웹마스터도구에서 검증/url 검사하면 meta항목에서 열람시 description, og:title 이든 한글이 모두 깨집니다 그런데 기존문서는 utf-8 로 되어 있어서 euc-kr로 바꿔보니...
1. 컴맹입니다. 2. 간단한 문서파일을 가족과 공유하기위해 아이피타임 공유기를 통한 간이 나스를 사용하고 있습니다. 3. 사용중이던 간이나스의 설정에서 문자셋이 EUC-KR로...