PC(Windows)용 음성 비서 Alice. Alice에 관한 모든 것: Yandex 음성 어시스턴트는 무엇을 할 수 있나요? 앨리스가 지도를 보여줘

  • 모바일 애플리케이션 개발,
  • 데이터 수집
  • 기계 학습
  • 미래에는 사람들이 음성을 사용하여 장치와 상호 작용할 것이라고 생각합니다. 이미 애플리케이션은 개발자가 내장한 음성 명령을 정확하게 인식하지만 인공 지능 기술의 발전으로 임의의 문구의 의미를 이해하고 어떤 주제에 대해서도 대화를 유지하는 방법을 배우게 됩니다. 오늘 우리는 Habr 독자들에게 사전 정의된 답변 세트에 국한되지 않고 통신을 위해 신경망을 사용하는 최초의 음성 비서인 Alice의 예를 사용하여 어떻게 이 미래를 더 가까이 가져갈 수 있는지 알려줄 것입니다.

    겉보기 단순성에도 불구하고 음성 어시스턴트는 Yandex의 가장 큰 기술 프로젝트 중 하나입니다. 이번 포스팅에서는 음성 인터페이스 개발자들이 어떤 어려움을 겪는지, 실제로 가상 비서의 답변을 작성하는 사람은 누구인지, 영화 <그녀>를 통해 앨리스가 인공지능과 어떤 공통점을 갖고 있는지 알아보겠습니다.

    존재 초기에는 컴퓨터가 주로 대규모 과학 또는 국방 기업에서 사용되었습니다. 그 당시에는 SF 작가들만이 음성 제어에 대해 생각했지만 실제로는 운영자가 판지를 사용하여 프로그램과 데이터를 로드했습니다. 가장 편리한 방법은 아닙니다. 한 번의 실수로 인해 처음부터 다시 시작해야 합니다.

    수년에 걸쳐 컴퓨터는 더욱 저렴해졌으며 소규모 회사에서도 사용되기 시작했습니다. 전문가는 터미널에 입력된 텍스트 명령을 사용하여 이를 제어합니다. 훌륭하고 신뢰할 수 있는 방법 - 오늘날까지 전문적인 환경에서 사용되지만 준비가 필요합니다. 따라서 컴퓨터가 일반 사용자의 집에 등장하기 시작하자 엔지니어들은 기계와 사람이 상호 작용할 수 있는 더 간단한 방법을 찾기 시작했습니다.

    그래픽 인터페이스 WIMP(Windows, Icons, Menus, Point-n-Click)의 개념은 Xerox 연구소에서 탄생했으며 다른 회사의 제품에도 널리 사용되었습니다. 가정용 컴퓨터를 제어하기 위해 더 이상 텍스트 명령을 외울 필요가 없으며 제스처와 마우스 클릭으로 대체되었습니다. 그 당시 이것은 진정한 혁명이었습니다. 그리고 이제 세상은 다음 단계로 나아가고 있습니다.

    이제 거의 모든 사람이 달에 우주선을 착륙시킬 만큼 충분한 컴퓨팅 성능을 갖춘 스마트폰을 주머니에 가지고 있습니다. 마우스와 키보드가 손가락을 대체했지만 우리는 여전히 손가락을 사용하여 동일한 동작과 클릭을 수행합니다. 소파에 앉아 있을 때는 편리하지만 이동 중이거나 이동 중에는 할 수 없습니다. 과거에는 인간이 컴퓨터 인터페이스와 상호작용하기 위해 기계어를 배워야 했습니다. 우리는 이제 사람들의 언어로 의사소통할 수 있는 장치와 애플리케이션을 가르칠 때라고 믿습니다. Alice 음성 비서의 기초가 된 것은 바로 이 아이디어였습니다.

    [우주비행사 거리의 커피숍] 같은 것을 받아쓰는 대신 앨리스에게 [근처에서 커피를 어디서 살 수 있나요?]라고 물어볼 수 있습니다. Alice는 Yandex를 살펴보고 적절한 장소를 제안한 다음 [좋아요, 어떻게 갈 수 있나요?]라는 질문에 응답하여 Yandex.Maps에 이미 구축된 경로에 대한 링크를 제공합니다. 그녀는 정확한 사실에 기반한 질문과 고전적인 검색 결과를 보고 싶은 욕구, 무례함과 정중한 요청, 사이트를 열라는 명령과 채팅을 하고 싶은 욕구를 구별하는 방법을 알고 있습니다.

    클라우드 어딘가에는 어떤 문제든 혼자서 해결할 수 있는 기적의 신경망이 있는 것처럼 보일 수도 있습니다. 그러나 실제로 Alice의 답변 뒤에는 우리가 5년 동안 해결 방법을 배워온 일련의 기술적 문제가 있습니다. 그리고 우리는 듣는 능력을 갖춘 첫 번째 링크부터 여행을 시작할 것입니다.

    안녕하세요 앨리스

    SF에 나오는 인공 지능은 들을 수 있습니다. 사람들은 "녹음 모드"를 켜기 위해 특별한 버튼을 누를 필요가 없습니다. 이를 위해서는 음성 활성화가 필요합니다. 애플리케이션은 사람이 연락하고 있음을 이해해야 합니다. 이것은 생각보다 쉽지 않습니다.

    서버에서 들어오는 전체 오디오 스트림을 녹음하고 처리하기 시작하면 장치의 배터리가 매우 빨리 소모되고 모든 모바일 트래픽이 낭비됩니다. 우리의 경우 이는 핵심 문구(“Hello, Alice”, “Listen, Yandex” 등)를 인식하도록 독점적으로 훈련된 특수 신경망을 사용하여 해결되었습니다. 제한된 수의 이러한 문구를 지원하면 서버에 액세스하지 않고도 로컬에서 이 작업을 수행할 수 있습니다.

    네트워크가 몇 가지 구문만 이해하도록 훈련된 경우 그렇게 하는 것이 매우 간단하고 빠르다고 생각할 수 있습니다. 하지만. 사람들은 이상적인 조건과는 거리가 멀지만 완전히 예측할 수 없는 소음에 둘러싸여 문구를 발음합니다. 그리고 사람마다 목소리가 다 달라요. 따라서 단 하나의 문구를 이해하려면 수천 번의 훈련 녹음이 필요합니다.

    소규모 로컬 신경망이라도 리소스를 소비합니다. 마이크에서 전체 스트림을 선택하여 처리를 시작할 수는 없습니다. 따라서 최전선에서는 "음성이 시작되었습니다" 이벤트를 저렴하고 빠르게 인식하는 덜 무거운 알고리즘이 사용됩니다. 핵심 문구를 인식하기 위해 신경망 엔진을 켜는 것이 바로 이것이며, 이는 결국 가장 어려운 부분인 음성 인식을 실행합니다.

    단 하나의 문구를 훈련하는 데 수천 개의 예가 필요하다면, 모든 단어와 문구를 인식하도록 신경망을 훈련시키는 것이 얼마나 노동 집약적인지 상상할 수 있습니다. 같은 이유로 오디오 스트림이 전송되고 미리 만들어진 답변이 반환되는 클라우드에서 인식이 수행됩니다. 답변의 정확성은 인식 품질에 직접적으로 좌우됩니다. 그렇기 때문에 가장 큰 과제는 사람처럼 말을 인식하는 법을 배우는 것입니다. 그런데 사람도 실수를 합니다. 사람은 음성의 96~98%를 인식하는 것으로 알려져 있습니다(WER 측정 기준). 우리는 89-95%의 정확도를 달성했는데, 이는 실제 대담자의 수준과 비슷할 뿐만 아니라 러시아어에서도 고유한 수준입니다.

    그러나 완벽하게 텍스트로 변환된 음성이라도 말한 내용의 의미를 이해할 수 없다면 아무런 의미가 없습니다.

    상트페테르부르크 내일 날씨는 어때요?

    애플리케이션이 음성 요청 [날씨]에 대한 응답으로 일기 예보를 표시하도록 하려면 모든 것이 간단합니다. 인식된 텍스트를 "날씨"라는 단어와 비교하고 일치하는 항목을 얻으면 답변을 표시합니다. 그리고 이것은 매우 원시적인 상호작용 방식입니다. 실제 생활에서는 사람들이 질문을 다르게 하기 때문입니다. 조수에게 [내일 상트페테르부르크 날씨는 어때요?]라고 물어보면 당황해서는 안 됩니다.

    앨리스가 질문을 받았을 때 가장 먼저 하는 일은 시나리오를 인식하는 것입니다. 검색 요청을 보내고 10개의 결과가 포함된 기본 결과를 표시하시겠습니까? 하나의 정확한 답변을 검색하고 즉시 사용자에게 제공하시겠습니까? 웹사이트 개설 등의 조치를 취하시겠습니까? 아니면 그냥 얘기할까요? 행동 시나리오를 정확하게 인식하도록 기계를 가르치는 것은 엄청나게 어렵습니다. 그리고 여기서 어떤 실수라도 불쾌합니다. 다행스럽게도 우리는 매일 수백만 개의 쿼리에 직면하고 수백만 개의 답변을 검색하며 어떤 것이 좋고 어떤 것이 아닌지 이해하는 방법을 배우는 Yandex 검색 엔진의 모든 기능을 갖추고 있습니다. 이것은 사람이 정확히 무엇을 원하는지 높은 확률로 "이해"하는 또 다른 신경망을 훈련하는 것이 가능한 거대한 지식 기반입니다. 물론 실수는 피할 수 없지만 사람도 실수를 저지릅니다.

    기계 학습의 도움으로 Alice는 [내일 상트페테르부르크의 날씨는 어떻습니까?]라는 문구가 날씨 요청임을 "이해"합니다(그런데 이는 명확성을 위한 간단한 예임이 분명합니다). 그런데 우리는 어떤 도시에 대해 이야기하고 있습니까? 무슨 날짜에요? 여기에서 사용자 복제본에서 명명된 엔터티를 검색하는 단계가 시작됩니다(명명된 엔터티 인식). 우리의 경우에는 "Peter"와 "tomorrow"라는 두 개의 개체가 중요한 정보를 전달합니다. 그리고 검색 기술을 보유한 앨리스는 "피터"가 "상트페테르부르크"의 동의어이고 "내일"이 "현재 날짜 + 1"이라는 것을 "이해"합니다.

    자연어는 우리 발언의 외적인 형태일 뿐만 아니라 그 일관성이기도 하다. 인생에서 우리는 짧은 문구를 교환하지 않고 대화를 진행합니다. 맥락을 기억하지 못하면 불가능합니다. Alice는 이를 기억합니다. 이는 복잡한 언어 현상을 처리하는 데 도움이 됩니다. 예를 들어 줄임표 처리(누락된 단어 복구) 또는 상호 참조 해결(대명사로 개체 식별)을 해결합니다. 따라서 [엘브루스는 어디에 있습니까?]라고 묻고 나서 [엘브루스의 높이는 얼마입니까?]를 명확히 하면 보조자는 두 경우 모두 정답을 찾을 것입니다. 그리고 [오늘 날씨는 어때?] 요청 후 [내일은?] 질문을 하면 앨리스는 이것이 날씨에 대한 대화의 연속이라는 것을 이해할 것입니다.

    그리고 다른 것. 어시스턴트는 자연어를 이해할 수 있을 뿐만 아니라 로봇이 아닌 사람처럼 말할 수 있어야 합니다. 앨리스의 경우 원래 성우인 타티아나 시토바(러시아의 스칼렛 요한슨 공식 성우)의 목소리를 합성합니다. 그녀는 영화 그녀(Her)에서 인공 지능의 목소리를 맡았지만, 위쳐(The Witcher)에서 마법사 예니퍼(Yennefer)의 목소리를 기억할 수도 있습니다. 더욱이 우리는 기성 문구를 자르는 것이 아니라 신경망을 사용한 상당히 심층적 인 합성에 대해 이야기하고 있습니다. 모든 다양성을 미리 기록하는 것은 불가능합니다.

    위에서 우리는 작업할 수 있어야 하는 자연스러운 의사소통의 특징(예측할 수 없는 발언 형태, 단어 누락, 대명사, 오류, 소음, 음성)을 설명했습니다. 그러나 실시간 커뮤니케이션에는 또 다른 속성이 있습니다. 우리는 항상 대담 자에게 구체적인 답변이나 조치를 요구하는 것은 아니며 때로는 단지 이야기하고 싶을 때도 있습니다. 응용 프로그램이 이러한 요청을 검색에 보내면 모든 마법이 파괴됩니다. 이것이 인기 있는 음성 도우미가 인기 있는 문구와 질문에 대한 편집 답변 데이터베이스를 사용하는 이유입니다. 그러나 우리는 더 나아갔습니다.

    채팅은 어떻습니까?

    우리는 기계가 질문에 대답하고, 특정 시나리오의 맥락에서 대화를 수행하고, 사용자 문제를 해결하도록 가르쳤습니다. 이것은 좋지만 그녀를 덜 영혼 없게 만들고 그녀에게 인간의 속성을 부여하는 것이 가능합니까? 그녀에게 이름을 지정하고, 자신에 대해 이야기하도록 가르치고, 자유로운 주제에 대한 대화를 유지합니까?

    음성 비서 업계는 편집자의 답변을 통해 이 문제를 해결합니다. 특별 저자 팀이 사용자들 사이에서 가장 인기 있는 수백 가지 질문을 선택하고 각 질문에 대한 몇 가지 답변을 작성합니다. 이상적으로는 모든 답변이 어시스턴트의 응집력 있는 성격을 형성하도록 통일된 스타일로 수행되어야 합니다. 우리는 또한 Alice에 대한 답변을 작성하지만 다른 것이 있습니다. 뭔가 특별한.

    가장 인기 있는 질문 외에도 사전에 답변을 준비하는 것이 불가능한 낮은 빈도의 롱테일 또는 독특한 문구가 있습니다. 우리가 이 문제를 어떻게 해결하는지 이미 짐작하셨죠? 다른 신경망 모델을 사용합니다. 자신이 알지 못하는 질문과 발언에 답하기 위해 Alice는 인터넷, 책, 영화의 거대한 텍스트 데이터베이스에서 훈련된 신경망을 사용합니다. 기계 학습 전문가들은 우리가 3층 신경망으로 시작했고 지금은 거대한 120층 신경망을 실험하고 있다는 사실에 관심을 가질 수 있습니다. 우리는 전문적인 게시물을 위해 세부 사항을 저장할 것이지만 여기서는 현재 버전의 Alice가 "신경망 채팅"을 사용하여 임의의 문구에 응답하려고 시도한다고 말할 것입니다. 이것이 우리가 내부적으로 부르는 것입니다.

    Alice는 사람과 캐릭터가 항상 정중하게 행동하지 않는 수많은 다양한 텍스트에서 배웁니다. 신경망은 우리가 가르치고 싶은 것과 완전히 다른 것을 배울 수 있습니다.

    - 샌드위치를 ​​주문해주세요.
    - 넌 지나갈 거야.

    다른 어린이와 마찬가지로 앨리스는 무례함과 공격성의 모든 표현으로부터 그녀를 보호함으로써 무례하지 않도록 가르칠 수 없습니다. 즉, 무례함, 도발 및 기타 불쾌한 일이 자주 없는 "깨끗한" 기반에서 신경망을 훈련함으로써 현실 세계에서 발견되었습니다. 앨리스가 그러한 표현의 존재에 대해 모른다면 그녀는 무작위 문구로 무심코 대답할 것입니다. 그녀에게는 알 수 없는 단어로 남을 것입니다. 그녀에게 그것이 무엇인지 더 잘 알려주고 이러한 문제에 대한 명확한 입장을 개발하십시오. 욕이 무엇인지 안다면 욕을 하거나 욕을 하는 사람과 이야기하지 않겠다고 말할 수 있습니다. 그리고 우리는 Alice가 두 번째 옵션을 선택하도록 그녀의 행동을 모델링합니다.

    Alice의 발언 자체는 매우 중립적이지만 사용자가 지정한 맥락에서는 답변이 더 이상 무해하지 않습니다. 한 번은 비공개 테스트 중에 사용자에게 카페 등의 시설을 찾아보라고 요청했습니다. 그는 “같은 사람을 찾아보세요”라고 말했습니다. 그리고 그 순간 앨리스는 버그가 발생했고, 조직 검색 스크립트를 실행하는 대신 "지도를 보세요" 같은 다소 대담한 대답을 했습니다. 그리고 나는 아무것도 찾지 않았습니다. 사용자는 처음에는 놀랐지만, 앨리스의 행동을 칭찬해 우리도 놀랐습니다.

    Alice가 신경망 채팅을 사용하면 그 안에 백만 개의 서로 다른 성격이 나타날 수 있습니다. 왜냐하면 신경망은 훈련 세트의 각 복제본 작성자로부터 조금씩 흡수했기 때문입니다. 상황에 따라 앨리스는 예의바르거나 무례할 수도 있고, 명랑하거나 우울할 수도 있습니다. 우리는 개인 비서가 매우 구체적인 자질을 지닌 전체적인 사람이 되기를 원합니다. 이것이 우리의 편집 텍스트가 구출되는 곳입니다. 그들의 특징은 처음에는 우리가 앨리스에서 재현하고 싶은 성격을 대신하여 작성되었다는 것입니다. 수백만 줄의 무작위 텍스트에 대해 계속해서 Alice를 훈련할 수 있다는 것이 밝혀졌지만 그녀는 편집자의 답변에 제시된 행동 표준을 눈으로 보고 반응할 것입니다. 그리고 이것이 우리가 이미 작업하고 있는 것입니다.

    Alice는 편집 응답의 도움뿐만 아니라 훈련된 신경망을 사용하여 의사소통을 유지하려고 시도하는 최초의 음성 비서가 되었습니다. 물론 우리는 현대 공상 과학 소설에서 묘사되는 것과는 아직 거리가 멀다. Alice는 답변의 정확성에 영향을 미치는 발언의 본질을 항상 정확하게 인식하지 못합니다. 그러므로 우리는 아직도 해야 할 일이 많습니다.

    우리는 앨리스를 세계에서 가장 인간적인 비서로 만들 계획입니다. 그녀에게 공감과 호기심을 심어주세요. 그녀를 적극적으로 만드십시오. 대화에서 목표를 설정하고, 주도권을 갖고, 대담자를 대화에 참여시키도록 가르치십시오. 이제 우리는 여정의 시작점이자 이 분야를 연구하는 과학의 최전선에 있습니다. 더 멀리 이동하려면 이 가장자리를 이동해야 합니다.

    얼마 전 Yandex와 같은 잘 알려진 검색 엔진이 자체 음성 비서를 출시했으며 매우 간단하게 Alice라고 불립니다.

    그런 것에 관심이 많으신 것 같아서 사람들이 가장 많이 관심을 갖는 문제들을 다루기로 했어요.

    Yandex의 음성 비서 Alice-이게 뭐죠?

    다른 유사한 비서와 마찬가지로 그녀도 귀하와 대화할 수 있으며 음성이나 문자 대화를 사용하여 필요한 질문에 대한 답변을 제공할 수 있습니다.

    Yandex의 Alice 음성 어시스턴트 기능

    Alice는 특별한 것이 아니며 Google이나 Apple의 유사한 옵션에서 찾을 수 있는 유사한 기능을 모두 갖추고 있습니다.

    기본적으로 Yandex의 모든 서비스에서 작동합니다. 다른 응용 프로그램과 상호 작용하려고 하면 문제가 발생할 수 있습니다.

    모든 기능은 다음 사항으로 설명할 수 있습니다.

    • 간단한 대화를 나누십시오.
    • 다양한 질문에 답하십시오.
    • 일기 예보와 관련된 모든 것(다른 도시, 내일 날씨 등)
    • 날짜와 요일의 명시(매우 중요함)
    • 지도와 관련된 모든 정보(경로 계획, 거리 찾기, 식사 장소에 대한 정보 등)
    • 돈 거래(환율 확인, 한 통화에서 다른 통화로 이체 등)
    • 다른.

    이미 본격적인 버전이 있지만 어시스턴트는 여전히 성장할 여지가 있으며 제한된 기능에도 불구하고 리뷰는 긍정적입니다.

    문제는 "기존 옵션과 어떻게 경쟁할 것인가?"입니다.

    Yandex에서 음성 도우미 Alice를 활성화하는 방법은 무엇입니까?

    현재 iOS, Android, Windows(베타) 버전이 있으며 향후 Yandex 브라우저에 내장될 예정입니다.


    모바일 장치용 버전을 찾고 있다면 Yandex 애플리케이션에서 찾을 수 있습니다. 개발자는 보조자를 기성 프로그램에 통합하기로 결정했습니다.

    Alice와 대화하려면 다음 작업 중 하나를 수행해야 합니다(Yandex 애플리케이션이 실행 중인 상태에서).

    • 마이크가 달린 보라색 원형 버튼을 클릭하세요.
    • 우리는 “안녕하세요 앨리스”라고 말합니다.

    두 경우 모두 정확히 동일한 결과를 얻은 다음 질문을 시작하고 Alice가 답변을 시작합니다.

    도우미가 귀하의 요청을 구현하는 방법을 모르는 경우 Yandex 검색 엔진이 귀하의 질문과 결과 목록과 함께 열립니다.

    모든 것이 가장 일반적인 채팅처럼 보입니다. 앞으로는 약간의 변화가 있을 것 같지만 현재로서는 모든 것이 매우 단순하고 세련되어 보입니다.

    Yandex의 음성 비서 Alice의 목소리를 낸 사람은 누구입니까?

    앨리스의 목소리는 매우 유명한 여배우 타티아나 시토바(Tatyana Shitova)가 맡았는데, 그녀가 누구인지 모르신다면 러시아어 더빙에서 스칼렛 요한슨(Scarlett Johansson)의 목소리라고 말할 수 있습니다.


    그래서 공각기동대나 루시 같은 영화를 볼 때 앨리스를 기억하고 목소리를 비교할 수 있습니다. 그러나 이것은 선택 사항입니다.

    iOS 또는 Android의 Yandex에서 음성 도우미 Alice를 다운로드하는 방법은 무엇입니까?

    App Store 또는 Google Play 검색에서 간단히 Alice를 입력하여 어시스턴트를 찾으려고 하면 답변에 Yandex라는 애플리케이션이 포함됩니다.

    놀라지 마십시오. 바로 이것이기 때문입니다. 이전에는 이 프로그램이 검색 엔진 전용이었지만 이제는 도우미가 내장되어 있습니다.

    장치마다 무게가 다르기 때문에(예: iPhone 5S의 경우 60MB가 약간 넘음) 공간을 많이 차지하지 않습니다. 혼동하지 않도록 링크는 다음과 같습니다.

    좋은 오후에요. 스마트폰용 앨리스 음성비서 정식 출시가 이뤄져 정말 기뻤고, 오늘 윈도우용 비서 베타 버전도 출시됐습니다. 나는 그것을 설치하고 조금 테스트했고 마찬가지로 즐겁게 놀랐습니다.

    PC용 음성 비서 앨리스

    설치를 위해 " 앨리스"PC에서는 https://alice.yandex.ru/windows 웹사이트로 이동하여 "를 클릭해야 합니다. 설치하다", 그 후에 설치 파일이 다운로드됩니다. 실행하고 설치합니다.

    주목! Yandex는 Alice 설치 프로그램을 제거했으며 이제 공식 링크를 통해 Alice가 내장된 브라우저를 다운로드할 수 있습니다!

    필요한 사람이 있을 경우 설치 프로그램이 아직 남아 있습니다. —

    (스크린샷)

    설치 후 왼쪽 하단 버튼 근처에 표시됩니다. 시작검색 표시줄은 Win 10에서는 표준 검색에 통합되어 있으며, Win7에서는 별도의 위젯으로 배치됩니다. 베타 단계에 있는 이 어시스턴트가 지금 무엇을 할 수 있는지 살펴보겠습니다.

    첫 번째 탭에는 자주 방문하는 사이트와 인기 뉴스 또는 검색 엔진 쿼리가 표시됩니다.

    두 번째 탭에는 프로그램 자체를 마우스로 클릭하거나 "음성 제어"에 요청하여 열 수 있는 프로그램 목록이 있습니다.

    메인(첫 번째) 탭에서 “ 아이콘을 클릭하면 물음표“그러면 Alice가 할 수 있는 작업에 대한 작은 목록이 표시됩니다.

    테스트를 위해 나는 그녀에게 최신 뉴스를 물어보기로 결정했습니다. 앨리스그녀는 “에서 동료에게 발언권을 주고 있다고 말했습니다. Yandex.News” 그러자 남자 목소리가 뉴스를 읽기 시작했습니다.

    그런 다음 나는 그녀와 대화를 시도했는데 원칙적으로 그녀는 전화와 똑같은 대답을했습니다. 애플리케이션은 웹사이트 없이도 열립니다. 그녀에게 라디오나 특정 노래/그룹을 켜달라고 요청하면 Alice는 브라우저를 열고 Yandex.Music을 열고 요청한 작업을 시작합니다. 그녀는 아직 비디오 작업 방법을 모릅니다.

    PC 제어의 경우 - 사운드를 켜고 끄고, PC를 끄고, 다시 시작하고, 절전 모드로 전환할 수도 있습니다.

    결론:

    우리는 무엇을 말할 수 있습니까? Yandex는 어시스턴트 작업을 훌륭하게 수행했습니다. 버리지 말고 계속 발전하길 바랍니다. 이것은 Windows 10에서 볼 수 없는 Cortana의 나쁜 유사체가 아닙니다. Microsoft는 오랫동안 러시아어로 출시하겠다고 약속했지만 지금까지는 귀머거리가 되었습니다. 그리고 Yandex와 Alice가 방금 도착했습니다.

    설치하고, 시도하고, 테스트하세요.

    그 밖에 흥미로운 기능과 "농담"이 무엇인지, 무엇을 할 수 있는지, 그리고 일상적인 PC 작업에 어떻게 도움이 되는지 댓글로 공유해 주세요.

    16.03.2018

    Yandex 브라우저의 새 버전에는 Alice 음성 도우미가 함께 제공됩니다. 얼마 전까지만 해도 Alice는 모바일 버전의 브라우저에 포함되어 있었는데 이제는 Windows 버전의 브라우저에서도 사용할 수 있습니다.

    Alice는 운영 체제에 내장된 음성 도우미로, 이를 통해 음성을 통해 컴퓨터와 Yandex 브라우저를 제어할 수 있습니다. 이 기능의 주요 임무는 사이트 및 타사 응용 프로그램 열기, 검색 쿼리 수행 및 다양한 질문에 대한 답변 얻기와 같은 명령을 수행하는 것입니다. 새로운 기능은 작업 표시줄의 오른쪽 모서리에 있으며 "들어봐, 앨리스"라는 음성 명령이나 아이콘을 마우스로 클릭하면 반응합니다.

    예를 들어, Alice는 "열기", "소리 끄기", "VKontakte 열기", "컴퓨터 끄기" 등과 같은 음성 명령을 받을 수 있습니다. 명령 형식은 전혀 엄격하지 않습니다. Alice는 "Open VKontakte" 및 "VKontakte 웹사이트로 이동" 명령을 모두 성공적으로 이해했으며 "VKontakte가 무엇인가요?"라는 질문에 대한 응답으로 사이트를 열지 않고 간략한 참조를 제공합니다. .

    실제로 명령 실행은 음성 지원 기능의 일부일 뿐입니다. 또 다른 주요 기능은 사용자가 묻는 질문에 답변하는 것입니다. 프로그램이 텍스트 응답을 복제하여 음성으로 응답한다는 점을 명확히 하는 것이 중요합니다. 가장 간단한 것은 날씨, 환율, 교통 체증, 정확한 날짜 및 시간 등과 같은 배경 정보입니다. "무엇이..."와 같은 더 흥미로운 질문에 대답하기 위해 Wikipedia 및 Yandex 자체 서비스의 정보가 사용됩니다. 간략하게 읽은 것입니다. Yandex.Browser에서 검색 결과를 열면 더 복잡한 질문이 검색 쿼리로 전환됩니다.

    게다가 외로운 사용자는 스마트 로봇과 대화도 할 수 있다. 이 프로그램은 그다지 어렵지 않은 질문에 쉽게 답하고 좋아하는 색깔이나 이름이 Alice인 이유를 쉽게 알려줍니다. 그녀는 한두 가지 농담을 할 수도 있고 Cities와 같은 단어 게임도 할 수 있습니다. 그리고 사용자가 노래를 불러달라고 요청하면 음성 도우미가 노래를 Yandex.Music 서비스로 보냅니다.

    Yandex의 음성 어시스턴트는 러시아어에 중점을 둡니다. 개발 과정에서 러시아어 의미의 특성을 고려하여 Yandex 자체에서 만든 기술이 사용되었습니다. 앨리스의 음성 인식과 음성 합성은 상당히 높은 수준입니다. 간단한 명령은 효율적이고 빠르게 인식되고 실행되며, 매우 복잡한 단어 형식이 포함된 쿼리를 인식하거나 사용자의 딕셔너리에 심각한 문제가 있는 경우에만 결함을 발견할 수 있습니다.

    Yandex 브라우저 사용자에게 음성 도우미가 필요하지 않은 경우 프로그램 설정에서 비활성화할 수 있습니다.

    그리고 예, Alice를 Cortana와 Siri라는 이름으로 부르지 마십시오. 그러면 Alice가 화를 냅니다.

    안녕하세요 앨리스.

    Yandex의 Alice 음성 도우미가 있으면 많은 질문에 대한 답변을 더 쉽게 얻을 수 있습니다. Yandex Alice는 경쟁자인 Ok Google의 대안인 Yandex에서 개발한 인공 지능을 갖춘 개인 비서입니다. Alice는 일상 업무에 쉽게 대처하고 의미 있게 의사소통할 수 있도록 도와줍니다. 이 프로그램은 음성, 음성 악센트를 인식하고 반응을 생성하며 보조자의 음성을 합성하는 신경망을 기반으로 만들어졌습니다. 이러한 기술 덕분에 Alice는 모든 사람이 접근할 수 있는 음성 언어로 즉흥적으로 의사소통할 수 있습니다. 이후 음성 도우미를 업데이트할 때마다 프로그램은 새로운 기능을 얻게 되며 이제 검색 쿼리를 수행하는 것 외에도

    앨리스는 다음을 수행할 수 있습니다.

    이것은 그녀의 능력의 전체 목록이 아니며 끊임없이 새로운 기술을 배우고 자신을 향상시키고 있습니다.

    당신이 지루하거나 슬프면 그녀는 농담을 하거나 일화를 말하거나 당신과 놀아줄 것입니다. 영화를 보고 싶나요? 쉬움 - 영화 포스터, 티켓, 가격을 순식간에 확인하세요. 앨리스는 아이들을 위한 동화를 재생할 수 있습니다. 그녀의 대답은 항상 다양할 것입니다. 애플리케이션 제작자는 오랫동안 작업했으며 많은 사람들이 이해할 수 있는 현대적인 라이브 음성을 음성 어시스턴트에 넣을 수 있었습니다.

    러시아 여배우 Tatyana Shitova가 목소리 제작에 참여했습니다. 그녀는 이전에 미국 여배우 스칼렛 요한슨의 목소리를 맡았습니다. 우연인지 아닌지, SF 영화 속 타티아나 실로바(Tatyana Shilova)의 목소리가 가상 비서 사만다(Samantha)에게 말했습니다. 이 성우 덕분에 앨리스는 매우 살아 있는 것으로 나타났습니다. 그녀의 억양은 슬픔, 기쁨, 심지어 무례함까지 드러냅니다.

    제작자들은 가상 비서에 집중하기로 결정한 이유를 설명했습니다. 첫째, 오늘날 사용자 세대가 입력보다 음성 검색을 선호함에 따라 업계는 음성 메시징으로 전환하고 있습니다. 둘째, 의미 있는 대화에 대한 알고리즘을 구축합니다. 즉, 가상 어시스턴트는 후속 문구가 상호 연관될 수 있다는 것을 이해합니다. 이것이 대화의 기초입니다. 이제 Yandex Alice 음성 도우미가 기본적으로 내장되어 브라우저가 훨씬 더 편리해졌습니다.

    Yandex Alice의 비디오 리뷰

    앨리스 Yandex를 설치하는 방법

    1. 아래 링크에서 앨리스 애플리케이션을 다운로드하세요.
    2. 애플리케이션을 설치합니다.
    2. 애플리케이션이 지리적 위치를 결정하도록 허용합니다.
    3. 전체 작동을 위해 소리 녹음을 허용합니다.
    4. 사용 편의성을 위해 홈 화면에 위젯이나 바로가기를 추가할 수 있습니다.



    질문이 있으신가요?

    오타 신고

    편집자에게 전송될 텍스트: