Microsoft và 15 cột mốc định hình tầm nhìn về AI
Gã khổng lồ công nghệ Microsoft sắp bước qua cột mốc 50 năm thành lập với nhiều thách thức trong thời đại trí tuệ nhân tạo (AI). Hãy cùng khám phá cách Microsoft sẽ phát triển nền tảng, công cụ và cơ sở hạ tầng AI cho tương lai.

Kể từ khi được thành lập vào năm 1975, Microsoft đã liên tục định hình cách xã hội sử dụng công nghệ, từ việc cách mạng hóa máy tính cá nhân với Office và Windows, đến mang lại sự giải trí cho cộng đồng chơi game bằng Xbox.
Trong những ngày làm việc đầu tiên năm 1975, dù Bill Gates không hề nghĩ đến AI nhưng không thể phủ nhận những đột phá công nghệ mà Microsoft đã phát triển trong 50 năm qua là những bước phát triển quan trọng dẫn đến kỷ nguyên AI hiện nay.
Hiện nay, dưới sự lãnh đạo của CEO Satya Nadella, công ty đã duy trì sự thống trị trong mảng điện toán đám mây với Azure và tiên phong trong cuộc đua AI với khoản đầu tư hàng tỷ USD vào OpenAI.
Khi AI đóng vai trò ngày một quan trọng hơn trong cuộc sống, hãy cùng khám phá cách Microsoft đã góp phần đặt nền tảng cho những cột mốc ngày nay và cách công ty dự định phát triển nền tảng, công cụ và cơ sở hạ tầng AI cho tương lai.
Bing ra mắt khả năng ngôn ngữ tự nhiên
Phát triển từ Windows Live Search, bản ra mắt năm 2009 của Bing đã giới thiệu một số tính năng máy học đáng chú ý, bao gồm các gợi ý tìm kiếm trong quá trình nhập truy vấn và danh sách các tìm kiếm liên quan. Các tính năng này sử dụng công nghệ ngữ nghĩa từ Powerset, một công ty mà Microsoft đã mua lại vào năm 2008.

Dự án Oxford đặt nền tảng cho những khả năng AI trong Azure
Nhiều tiến bộ kỹ thuật của Microsoft được xây dựng dựa trên thành công của Azure. Được phát hành vào năm 2015, dự án Project Oxford cung cấp cho các nhà phát triển một bộ công nghệ để xây dựng các ứng dụng thông minh với tính năng phát hiện khuôn mặt, nhận dạng giọng nói và hiểu ngôn ngữ. Hiện tại, nó được biết đến với tên Azure AI Foundry.
“Tất cả điều này phần lớn đều bắt nguồn từ Bing”, Eric Boyd, Phó chủ tịch tập đoàn Microsoft, phụ trách Nền tảng Azure AI, người đã bắt đầu hành trình tại Microsoft trong bộ phận Phát triển Quảng cáo Bing, cho biết. “Chúng tôi đã xây dựng toàn bộ cơ sở hạ tầng này với mục đích đào tạo và thử nghiệm các mô hình AI để xem mô hình nào tốt nhất. Đây chính là nền tảng cho những thứ mà chúng tôi hiện cung cấp thông qua Azure AI”.
Các sản phẩm quan trọng được phát triển từ Azure bao gồm ứng dụng AI đàm thoại, Microsoft Cognitive Services, Microsoft AI và Microsoft AI and Ethics in Engineering and Research (AETHER), và Azure OpenAI Service, kết hợp các mô hình ngôn ngữ mạnh mẽ với các khả năng doanh nghiệp của Azure. Ngày nay, hơn 60.000 tổ chức trên thế giới đang sử dụng Azure AI Foundry và 65% doanh nghiệp trong danh sách Fortune 500 đã áp dụng dịch vụ Azure OpenAI.
Một khuôn khổ mới thúc đẩy hiệu suất và đào tạo mô hình học sâu
Năm 2015, Microsoft Research đã giới thiệu một đột phá mới, mô hình học sâu ResNet. Khung học tập này đã cải thiện đáng kể việc đào tạo các mạng nơ-ron sâu, cho phép phát triển các kiến trúc sâu hơn với hiệu suất tốt hơn. Điều này đã mở ra cánh cửa cho nhiều ứng dụng thực tiễn, nhiều trong số đó rất quan trọng đối với cuộc sống của chúng ta ngày nay.

“ResNet đã đặt ra tiêu chuẩn cho thị giác máy tính hiện đang được sử dụng mọi nơi,” Peter Lee, Chủ tịch Microsoft Research, cho biết.
“Nếu bạn có một chiếc xe tự lái, nó đang sử dụng AI dựa trên ResNet. Nếu bạn đang thực hiện chụp MRI trong phòng khám, máy MRI đó cũng có công nghệ dựa trên ResNet”.
Một bước tiến trong việc học đa giác quan và đa ngôn ngữ
Trong khoảng thời gian 5 năm bắt đầu từ 2015, Microsoft đã đạt được khả năng tương đương với con người trên một số tiêu chuẩn về nhận dạng giọng nói đàm thoại, dịch máy, trả lời câu hỏi đàm thoại, đọc hiểu máy và chú thích hình ảnh.
Những bước đột phá này là chìa khóa để tạo ra một bước nhảy vọt trong khả năng của AI, đạt được mức độ học tập đa giác quan và đa ngôn ngữ gần hơn với cách con người học và hiểu. Những đột phá này đã dẫn đến sự phát triển của Microsoft về XYZ-code, giao điểm của ba thuộc tính của nhận thức con người: văn bản đơn ngữ (X), tín hiệu cảm giác âm thanh hoặc hình ảnh (Y) và đa ngôn ngữ (Z) - đều đã được tích hợp vào các dịch vụ AI của Azure để giúp khách hàng tăng tốc các hệ thống AI mạnh mẽ và tích hợp hơn.
Tăng cường khả năng tiếp cận bằng cách làm cho thế giới trực quan hơn
Với mục tiêu tạo ra công nghệ tăng cường khả năng tiếp cận, Microsoft đã giới thiệu Seeing AI vào năm 2016. Ví dụ thực tế về AI này là sử dụng thị giác máy tính và xử lý ngôn ngữ tự nhiên để mô tả môi trường xung quanh của một người, đọc văn bản, trả lời câu hỏi, nhận dạng tiền tệ và thậm chí mô tả biểu cảm khuôn mặt.
Tính năng Find My Things giúp người khiếm thị hoặc thị lực kém cá nhân hóa trải nghiệm bằng cách dạy công cụ nhận diện các vật dụng họ thường sử dụng và có thể bị thất lạc. Những vật dụng này có thể bao gồm các vật nhỏ như chìa khóa nhà hoặc tai nghe.
Khả năng tiếp cận giúp các công cụ và công nghệ của Microsoft trở nên dễ sử dụng hơn cho mọi người và thúc đẩy sự đổi mới cho thế giới, bao gồm cả các sản phẩm như Reading Coach, giúp học sinh học đọc và hỗ trợ những người mới học và người mắc chứng khó đọc.
Thay đổi tốc độ xử lý của AI
Năm 2017 đánh dấu sự ra đời của Brainwave, một nền tảng tăng tốc học sâu được thiết kế để chạy các khối lượng công việc AI theo thời gian thực quy mô lớn trên hạ tầng đám mây của Microsoft.
Brainwave kết hợp FPGAs với phần mềm hiệu suất cao, giúp tăng đáng kể hiệu suất của các mô hình AI, đặc biệt là cho các nhiệm vụ như nhận dạng hình ảnh và xử lý ngôn ngữ tự nhiên. Brainwave đánh dấu một bước tiến quan trọng trong cách Microsoft tiếp cận phần cứng AI và suy luận AI dựa trên đám mây.
Thiết lập nền tảng cho sự đổi mới trong các mô hình ngôn ngữ lớn
Năm 2020, Microsoft phát hành Turing-NLG (Natural Language Generation), một trong những mô hình ngôn ngữ lớn nhất vào thời điểm đó với 17 tỷ tham số. Điều này minh chứng cho sự đi đầu của Microsoft trong việc phát triển AI để hiểu ngôn ngữ tự nhiên và là tiền đề cho sự phát triển của các mô hình nền tảng khác như Florence nhận dạng hình ảnh.
Nuance giới thiệu giải pháp AI lâm sàng đầu tiên cho lĩnh vực chăm sóc sức khỏe
DAX Copilot, hiện được tích hợp trong Dragon Copilot, là một bước tiến lớn trong lĩnh vực chăm sóc sức khỏe, sử dụng AI hỗ trợ giọng nói để giúp các bác sĩ ghi chép nội dung các cuộc trò chuyện giữa bác sĩ, bệnh nhân và gia đình, giúp họ tập trung hoàn toàn vào bệnh nhân và giảm khối lượng công việc sau giờ làm.
Năm 2020, DAX đã được ra mắt rộng rãi. Năm 2023, DAX Express trở thành giải pháp đầu tiên kết hợp AI đàm thoại và môi trường với GPT-4. Giải pháp này hiện đang được hơn 600 hệ thống chăm sóc sức khỏe lớn trên thế giới tin cậy, tạo ra hơn 3 triệu tập chăm sóc mỗi tháng và đang tiếp tục phát triển.
Cơ sở hạ tầng siêu máy tính chưa từng có trong Azure thúc đẩy sự đột phá của OpenAI
Cũng trong năm 2020, Microsoft đã giới thiệu một siêu máy tính mới được lưu trữ trên Azure cho OpenAI, thiết lập cơ sở hạ tầng mới để đào tạo các mô hình AI lớn và là bước đầu tiên trong việc biến chúng thành nền tảng. Vào thời điểm ra mắt, siêu máy tính của Microsoft thuộc Top 5 siêu máy tính trên thế giới.
Trong những năm tiếp theo, Microsoft đã mở rộng cơ sở hạ tầng này với các siêu máy tính AI có quy mô chưa từng có để đạt được những thành tựu lớn về hiệu suất ứng dụng cho đào tạo và suy luận AI.
Mối quan hệ đối tác với OpenAI được hình thành trên nền tảng của những lý tưởng chung và sự thúc đẩy tiến bộ có trách nhiệm trong công nghệ AI. Cùng nhau, hai công ty đã xây dựng một cơ sở hạ tầng siêu máy tính chưa từng có trên Azure để thúc đẩy những tiến bộ của OpenAI, và thông qua sự hợp tác đó để hiểu rõ hơn không chỉ về cách tạo ra nền tảng AI tốt nhất thế giới, mà quan trọng hơn là cách mang lại lợi ích của nó cho khách hàng và cho xã hội.
Mở ra cánh cửa mới cho lập trình bằng AI
Việc Microsoft mua lại GitHub đã dẫn đến việc tạo ra GitHub Copilot vào năm 2021. Trợ lý lập trình AI này cho phép các nhà phát triển chọn các mô hình như Anthropic’s Claude 3.5 Sonnet, Google Gemini 2.0 Flash và OpenAI’s o3-mini và GPT-4o, giúp các nhà phát triển viết mã hiệu quả hơn thông qua các đoạn mã gợi ý và các phản hồi theo ngữ cảnh.

Đây là một bước tiến quan trọng trong việc cung cấp nền tảng AI để trao quyền cho khách hàng, cá nhân và người sáng tạo ở khắp mọi nơi. Kể từ đó, GitHub Copilot đã trở thành công cụ lập trình AI được lựa chọn của hơn 77.000 tổ chức trên khắp các khu vực và ngành công nghiệp.
AI tái tạo khả năng tìm kiếm và mở ra làn sóng đổi mới trong cuộc sống và công việc
Năm 2023, Bing và Edge đã được tích hợp AI, tạo ra một sự thay đổi lớn trong cách mọi người sử dụng công cụ tìm kiếm. Điều này cũng đã thúc đẩy sự phát triển nhanh chóng của Copilot và tích hợp công cụ này vào toàn bộ hệ sản phẩm của Microsoft trong hơn một năm tiếp theo.
Copilot tiếp tục phát triển, trở thành không chỉ là một công cụ cung cấp thông tin mà còn là một người bạn đồng hành AI thực sự với việc ra mắt ứng dụng Copilot được cập nhật dành cho người tiêu dùng. Việc giới thiệu tính năng Giọng nói và Tầm nhìn cho phép Copilot thích ứng với người dùng và cung cấp các câu trả lời, khích lệ và tư vấn khi mọi người đối mặt với những thách thức hàng ngày.
Những đổi mới với Copilot
7/2/2023: Copilot trong Bing
6/3/2023: Microsoft Dynamics 365 Copilot
16/3/2023: Microsoft 365 Copilot
16/3/2023: Copilot trong Power Platform
22/3/2023: GitHub Copilot X
28/3/2023: Microsoft Security Copilot
20/4/2023: Copilot trong Microsoft Viva
23/5/2023: Copilot trên Windows
15/1/2024: Copilot Pro
21/5/2024: Công cụ Copilot Studio để xây dựng các tác nhân tự động
4/1/ 2024: Copilot key trên các thiết bị Windows 11
1/10/2024: Trải nghiệm người dùng Copilot được cập nhật với Vision và Voice
15/1/2025: Microsoft 365 Copilot Chat + Agents
16/1/2025: Copilot trong các gói đăng ký cá nhân và gia đình của Microsoft 365
25/3/2025: Lý luận sâu sắc trong Microsoft 365
Ra mắt máy tính Windows mới được thiết kế cho AI
Dựa trên những công việc được khởi nguồn từ năm 2019 với sự ra mắt của Surface Pro X, Copilot+ PCs được giới thiệu vào năm 2024 với kiến trúc hệ thống hoàn toàn mới nhằm kết hợp sức mạnh của CPU, GPU và NPU hiệu suất cao mới.
Tận dụng khả năng của NPU, Copilot+ PCs đạt được một mức độ hiệu suất chưa từng thấy trước đây – mạnh hơn gấp 20 lần và hiệu quả gấp 100 lần trong việc chạy các khối lượng công việc AI. Điều này đã mở ra một loạt trải nghiệm AI hoàn toàn mới, giúp hoàn thành công việc trên PC nhanh hơn, đơn giản hơn và cá nhân hóa hơn.
Một khuôn khổ mới để xây dựng các tác nhân AI
Ra mắt vào năm 2023, AutoGen là một khung lập trình mã nguồn mở giúp xây dựng các tác nhân AI và tạo điều kiện hợp tác giữa nhiều tác nhân để giải quyết các nhiệm vụ.
AutoGen cung cấp một khung dễ sử dụng và linh hoạt để tăng tốc phát triển và nghiên cứu về tác nhân AI. Những phản hồi từ cộng đồng các nhà phát triển đối với AutoGen đã giúp xác định giai đoạn và các trường hợp sử dụng chính cho các sản phẩm tác nhân của Microsoft.
Tiên phong trong danh mục mô hình ngôn ngữ nhỏ với Phi
Ra đời năm 2024, Phi tiên phong trong hạng mục các mô hình ngôn ngữ nhỏ, tạo ra sự đổi mới mô hình tùy chỉnh, tiết kiệm chi phí và làm cho AI trở nên dễ tiếp cận hơn, ví dụ trên điện thoại thông minh và các thiết bị di động khác hoạt động “ở cạnh”, mà không kết nối với đám mây.
Kể từ đó, Microsoft đã giới thiệu nhiều phiên bản Phi hơn cho danh mục mô hình Azure AI Foundry bao gồm các mô hình Phi cụ thể cho từng ngành.
Mô hình AI tạo sinh đầu tiên dành cho trò chơi
Một bước đột phá trong ý tưởng trò chơi, mô hình Muse, ra mắt vào năm 2025, đã phát triển sự hiểu biết sâu sắc về môi trường. Khả năng của ChatGPT và GPT-4 trong việc học ngôn ngữ hiện nay đã ngang bằng với khả năng của AI trong việc học cơ chế hoạt động của mọi thứ. Điều này mở ra khả năng lặp lại và phối lại nhanh chóng và sáng tạo trong trò chơi điện tử để các nhà phát triển có thể tạo ra các môi trường nhập vai một cách sáng tạo.
Những tiến bộ này chỉ là bề nổi trong cam kết của Microsoft đối với AI và tiềm năng của công nghệ này trong việc giúp đạt được sứ mệnh trao quyền cho mọi cá nhân và mọi tổ chức trên thế giới để họ đạt được nhiều thành tựu hơn. Từ việc cải thiện dịch vụ chăm sóc y tế đến bảo vệ sự đa dạng sinh học, khả năng và tác động của AI vẫn là vô tận./.