관리자
59
2024-05-22
내역사업 | (3월) 팁스(TIPS) 창업기업 지원계획 통합공고 |
---|
과제명 | SaaS 기반 텍스트 마이닝 특화 빅데이터 분석 플랫폼 | ||||
---|---|---|---|---|---|
과제고유번호 | 1425165469 | ||||
부처명 | 중소벤처기업부 | ||||
시행계획 내 사업명 | |||||
시행계획 내 사업유형 | 예산출처지역 | 대전광역시 | 사업수행지역 | 대전광역시 | |
계속/신규 과제구분 | 신규과제 | ||||
과제수행연도 | 2022 | 총연구기간 | 2022-04-01 ~ 2024-03-31 | 당해연도 연구기간 | 2022-04-01 ~ 2023-03-31 |
연구목표 | 1) 한국어 사전 구축가) 형태소 기분석 사전: 형태소 분석기의 속도와 정확도를 향상시키고, 과분석을 줄이기 위해 세종말뭉치, 온라인 후기, SNS 데이터 등을 이용나) 개체명 사전: 성능에 중요한 영향을 미치는 사전정보를 자질로 이용하기 위해 위키피디아, 온라인 사전 등을 이용2) 자연어 구문 및 의미 이해 엔진 개발가) 자연어 구문 이해 엔진: 신조어 ... | ||
---|---|---|---|
연구내용 | 1) 자연어 구문 이해 엔진신조어 및 다국어 언어 확장에 적합한 머신러닝 기반 고성능 형태소 분석기 개발● 사전과 음절학습을 통합한 형태소 분석기* 복합명사 단위 형태소 사전: 200만건 구축* 어절 단위 사전: 700만건 구축● 다국어 언어 확장을 위한 형태소 분석 방법* SVM 기반 언어 독립적인 음절 학습 적용● 자가학습(Self-training) 기... | ||
기대효과 | 1) 키워드 추출기를 이용한 트렌드 분석● 상대적 단어 빈도 스코어는 두 집단을 구분할 수 있는 모든 종류의 단어들 (features)을 키워드로 선택하지만, L1 regularization이 적용된 Lasso regression의 경우에는 집단 구분 최소 단어를 선택함으로써 키워드 종류를 줄여줌● 이 방법을 문서 군집화와 함께 이용할 경우 하루 뉴스의 토... | ||
키워드 | 텍스트마이닝,자연어처리,형태소분석,개체명인식,감성분석 |
단독연구 | 기업 | 대학 | 국공립(연)/출연(연) | 외국연구기관 | 기타 |
---|---|---|---|---|---|
|
연구개발단계 | 개발연구 | 산업기술분류 | |
---|---|---|---|
미래유망신기술(6T) | IT(정보기술) | 기술수명주기 | |
연구수행주체 | 산 | 과학기술표준분류 | 인공물 > 정보/통신 > 소프트웨어 > S/W 솔루션 |
주력산업분류 | 적용분야 | 교통/정보통신/기타기반시설 | |
중점과학기술분류 | 과제유형 |
과제수행기관(업) 정보 | 과제수행기관(업)명 | (주)유펜솔루션 | 사업자등록번호 | |
---|---|---|---|---|
연구책임자 | 소속기관명 | (주)유펜솔루션 | 사업자등록번호 | |
최종학위 | 학사이하 | 최종학력전공 | 공학 |
국비 | 145,000,000 | 지방비(현금+현물) | 0 |
---|---|---|---|
비고 |