R&D 정보

과제 상세정보

목록

SaaS 기반 텍스트 마이닝 특화 빅데이터 분석 플랫폼

작성자

관리자

조회수

59

등록일

2024-05-22

사업 정보
내역사업 (3월) 팁스(TIPS) 창업기업 지원계획 통합공고
과제 기본정보
과제명 SaaS 기반 텍스트 마이닝 특화 빅데이터 분석 플랫폼
과제고유번호 1425165469
부처명 중소벤처기업부
시행계획 내 사업명
시행계획 내 사업유형 예산출처지역 대전광역시 사업수행지역 대전광역시
계속/신규 과제구분 신규과제
과제수행연도 2022 총연구기간 2022-04-01 ~ 2024-03-31 당해연도 연구기간 2022-04-01 ~ 2023-03-31
요약 정보
연구목표 1) 한국어 사전 구축가) 형태소 기분석 사전: 형태소 분석기의 속도와 정확도를 향상시키고, 과분석을 줄이기 위해 세종말뭉치, 온라인 후기, SNS 데이터 등을 이용나) 개체명 사전: 성능에 중요한 영향을 미치는 사전정보를 자질로 이용하기 위해 위키피디아, 온라인 사전 등을 이용2) 자연어 구문 및 의미 이해 엔진 개발가) 자연어 구문 이해 엔진: 신조어 ...
연구내용 1) 자연어 구문 이해 엔진신조어 및 다국어 언어 확장에 적합한 머신러닝 기반 고성능 형태소 분석기 개발● 사전과 음절학습을 통합한 형태소 분석기* 복합명사 단위 형태소 사전: 200만건 구축* 어절 단위 사전: 700만건 구축● 다국어 언어 확장을 위한 형태소 분석 방법* SVM 기반 언어 독립적인 음절 학습 적용● 자가학습(Self-training) 기...
기대효과 1) 키워드 추출기를 이용한 트렌드 분석● 상대적 단어 빈도 스코어는 두 집단을 구분할 수 있는 모든 종류의 단어들 (features)을 키워드로 선택하지만, L1 regularization이 적용된 Lasso regression의 경우에는 집단 구분 최소 단어를 선택함으로써 키워드 종류를 줄여줌● 이 방법을 문서 군집화와 함께 이용할 경우 하루 뉴스의 토...
키워드 텍스트마이닝,자연어처리,형태소분석,개체명인식,감성분석
위탁/공동여부 정보
단독연구 기업 대학 국공립(연)/출연(연) 외국연구기관 기타
기술 정보
연구개발단계 개발연구 산업기술분류
미래유망신기술(6T) IT(정보기술) 기술수명주기
연구수행주체 과학기술표준분류 인공물 > 정보/통신 > 소프트웨어 > S/W 솔루션
주력산업분류 적용분야 교통/정보통신/기타기반시설
중점과학기술분류 과제유형
과제수행기관(업) 정보
과제수행기관(업) 정보 과제수행기관(업)명 (주)유펜솔루션 사업자등록번호
연구책임자 소속기관명 (주)유펜솔루션 사업자등록번호
최종학위 학사이하 최종학력전공 공학
사업비
국비 145,000,000 지방비(현금+현물) 0
비고