관리자
118
2024-05-22
| 내역사업 | (3월) 팁스(TIPS) 창업기업 지원계획 통합공고 |
|---|
| 과제명 | SaaS 기반 텍스트 마이닝 특화 빅데이터 분석 플랫폼 | ||||
|---|---|---|---|---|---|
| 과제고유번호 | 1425165469 | ||||
| 부처명 | 중소벤처기업부 | ||||
| 시행계획 내 사업명 | |||||
| 시행계획 내 사업유형 | 예산출처지역 | 대전광역시 | 사업수행지역 | 대전광역시 | |
| 계속/신규 과제구분 | 신규과제 | ||||
| 과제수행연도 | 2022 | 총연구기간 | 2022-04-01 ~ 2024-03-31 | 당해연도 연구기간 | 2022-04-01 ~ 2023-03-31 |
| 연구목표 | 1) 한국어 사전 구축가) 형태소 기분석 사전: 형태소 분석기의 속도와 정확도를 향상시키고, 과분석을 줄이기 위해 세종말뭉치, 온라인 후기, SNS 데이터 등을 이용나) 개체명 사전: 성능에 중요한 영향을 미치는 사전정보를 자질로 이용하기 위해 위키피디아, 온라인 사전 등을 이용2) 자연어 구문 및 의미 이해 엔진 개발가) 자연어 구문 이해 엔진: 신조어 ... | ||
|---|---|---|---|
| 연구내용 | 1) 자연어 구문 이해 엔진신조어 및 다국어 언어 확장에 적합한 머신러닝 기반 고성능 형태소 분석기 개발● 사전과 음절학습을 통합한 형태소 분석기* 복합명사 단위 형태소 사전: 200만건 구축* 어절 단위 사전: 700만건 구축● 다국어 언어 확장을 위한 형태소 분석 방법* SVM 기반 언어 독립적인 음절 학습 적용● 자가학습(Self-training) 기... | ||
| 기대효과 | 1) 키워드 추출기를 이용한 트렌드 분석● 상대적 단어 빈도 스코어는 두 집단을 구분할 수 있는 모든 종류의 단어들 (features)을 키워드로 선택하지만, L1 regularization이 적용된 Lasso regression의 경우에는 집단 구분 최소 단어를 선택함으로써 키워드 종류를 줄여줌● 이 방법을 문서 군집화와 함께 이용할 경우 하루 뉴스의 토... | ||
| 키워드 | 텍스트마이닝,자연어처리,형태소분석,개체명인식,감성분석 | ||
| 단독연구 | 기업 | 대학 | 국공립(연)/출연(연) | 외국연구기관 | 기타 |
|---|---|---|---|---|---|
|
|
| 연구개발단계 | 개발연구 | 산업기술분류 | |
|---|---|---|---|
| 미래유망신기술(6T) | IT(정보기술) | 기술수명주기 | |
| 연구수행주체 | 산 | 과학기술표준분류 | 인공물 > 정보/통신 > 소프트웨어 > S/W 솔루션 |
| 주력산업분류 | 적용분야 | 교통/정보통신/기타기반시설 | |
| 중점과학기술분류 | 과제유형 |
| 과제수행기관(업) 정보 | 과제수행기관(업)명 | (주)유펜솔루션 | 사업자등록번호 | |
|---|---|---|---|---|
| 연구책임자 | 소속기관명 | (주)유펜솔루션 | 사업자등록번호 | |
| 최종학위 | 학사이하 | 최종학력전공 | 공학 |
| 국비 | 145,000,000 | 지방비(현금+현물) | 0 |
|---|---|---|---|
| 비고 | |||