Watson có 200 triệu trang tài liệu có sắp xếp và không sắp xếp, sử dụng đến 4 terabytes chỗ chứa ổ cứng. [ 7 ]
IBM tuyên bố:
Watson là một chương trình ứng dụng gồm những kỹ thuật hạng sang về giải quyết và xử lý ngôn từ tự nhiên, tìm kiếm thông tin, diễn đạt và lý giải tri thức, và học máy cho lãnh vực vấn đáp những câu hỏi có khoanh vùng phạm vi lan rộng ra. Ở phần cốt lõi, Watson được kiến thiết xây dựng dựa trên kỹ thuật DeepQA của IBM để tạo ra giả thuyết, tập hợp vô số dữ kiện, nghiên cứu và phân tích và kiếm được điểm. [ 8 ]
Watson là một hệ thống tinh vi cho khối lượng lớn công việc, được thiết kế cho phân tích phức tạp, có thể khai triển được bằng việc kết hợp song song rất nhiều bộ xử lý POWER7 và phần mềm IBM DeepQA để trả lời các câu hỏi của chương trình Jeopardy! trong dỏn vẹn dưới 3 giây đồng hồ. Watson được cấu thành từ một chuỗi gồm 90 máy chủ IBM Power 750 (cộng thêm các hệ thống kiểm soát, hệ thống mạng, và hệ thống I/O nằm trong 10 giàn máy) với tổng cộng khoảng 2.880 nhân xử lý POWER7 (processor core) và 16 Terabytes bộ nhớ. Mỗi máy chủ Power 750 sử dụng những bộ xử lý gồm có 8 nhân xử lý POWER7 có tốc độ 3,5 GHz, mỗi nhân xử lý có bốn thread. Khả năng xử lý song song rất lớn của bộ xử lý POWER7 là nhân tố thích hợp lý tưởng cho chương trình phần mềm Watsons IBM DeepQA…..[9]
Mặc dù đây chính yếu là một nỗ lực của IBM nhưng đội ngũ tăng trưởng còn gồm có giáo sư và sinh viên thuộc Đại học Carnegie Mellon, Đại học Massachusetts, Đại học Southern California / Viện Khoa học tin tức, Đại học Texas tại Austin, Học viện Kỹ thuật Massachusetts, Đại học Trento, và Viện Bách khoa Rensselaer. [ 10 ]
Watson chạy trên hai đơn vị chức năng gồm 5 giàn máy trong đó có 90 sever IBM Power7 50 ( mỗi sever có 4 bộ giải quyết và xử lý TT, mỗi bộ giải quyết và xử lý có 8 nhân giải quyết và xử lý và mỗi nhân giải quyết và xử lý có 4 thread ) và bộ nhớ của nó lên đến ” trên 15 TB “. [ 11 ] Cho đến thời gian này vẫn chưa rõ là đơn vị chức năng đo lượng bộ nhớ của nó là nhị phân ( lũy thừa 1024 ) hay thập phân ( lũy thừa 1000 ). Có một nguồn cho rằng [ 12 ] :
[ … ] mạng lưới hệ thống này là một chuỗi gồm 90 sever IBM Power 750, mỗi sever gồm có 32 nhân giải quyết và xử lý POWER7 chạy với vận tốc 3,55 GHz [ … ] Watson hoàn toàn có thể giải quyết và xử lý 500 gigabytes mỗi giây [ … ] Hơn nữa, mỗi máy trong số 32 sever đó được phân phối với khoảng chừng 256 GB bộ nhớ [ … ] Watson không chịu ràng buộc vào những tài liệu chứa trong ổ cứng vì tìm tài liệu ở ổ cứng rất lừ đừ .
Một viên chức hành chính của IBM đã đề nghị Watson tranh tài trên chương trình trò chơi truyền hình Jeopardy! nhưng lời đề nghị đó ban đầu bị bỏ qua. Trong các cuộc tranh tài do chính phủ Hoa Kỳ điều hành, các tiền bối trước đó của Watson đã có thể trả lời không quá 70% câu hỏi một cách chính xác và thường mất khoảng vài phút để có được câu trả lời. Để tranh tài thành công trên Jeopardy!, Watson cần phải có được câu trả lời không quá vài giây, và vấn đề thử thách này ban đầu có vẻ như không thể nào giải quyết được.[13]
Trong những lần thử nghiệm ban đầu do David Ferrucci, giám đốc cao cấp của phân bộ IBM’s Semantic Analysis and Integration thực hiện vào năm 2006, Watson được cho 500 gợi ý từ các lần Jeopardy! trước đây. Trong khi những người thật tranh tài tốp cao bấm nút phân nửa thời gian và trả lời đúng đến 95% câu hỏi thì trong vòng đầu tiên Watson chỉ có thể trả lời đúng có 15%. Năm 2007, đội ngũ IBM được giao nhiệm vụ từ 3 đến 5 năm cùng tổng số 15 người để phát triển giải pháp cho những vấn đề gặp phải.
Đội ngũ IBM phân phối cho Watson khoảng chừng hàng triệu tài liệu, trong đó có những tự điển, bách khoa tự điển và những tài liệu tìm hiểu thêm khác để nó hoàn toàn có thể dùng để kiến thiết xây dựng tri thức, thí dụ như thánh kinh, tiểu thuyết hay kịch. Không phải dựa vào một giải pháp đo lường và thống kê đơn độc mà Watson lại sử dụng hàng ngàn giải pháp thống kê giám sát cùng lúc để hiểu được câu hỏi và tìm ra hướng đúng để vấn đáp câu hỏi đó. [ 14 ] Là một chương trình đơn độc, Watson không vận dụng Internet khi chơi chương trình game show truyền hình. [ 15 ]Ba chuyên viên về trí tuệ nhân tạo, trong đó có người chỉ huy đội ngũ Watson, có nói về viễn cảnh của siêu máy tính này. Nếu càng có nhiều giải pháp giám sát được sử dụng cho cùng câu hỏi thì Watson càng có năng lực vấn đáp đúng hơn. Một khi Watson có được một số lượng nhỏ gồm những câu vấn đáp tiềm năng thì nó hoàn toàn có thể tra cứu so sánh với cơ sở dử liệu của nó để chọn ra giải đáp có nghĩa. Trong 1 loạt gồm 20 buổi game show giả, người tham gia đã giả bộ dùng từ 6 đến 8 giây đồng hồ đeo tay tìm ra câu vấn đáp để quyết định hành động có nên bấm nút để đưa ra câu vấn đáp đúng hay không. Trong suốt khoảng chừng thời hạn này, Watson cũng hoàn toàn có thể nhìn nhận câu vấn đáp và quyết định hành động xem là nó có đủ tự tin để bấm nút xin vấn đáp thắc mắc hay không. [ 13 ]
Vào năm 2008, các nhà phát triển đã nâng cấp Watson đến điểm mà nó có thể tranh tài với các nhà quán quân của chương trình Jeopardy!. Vào năm đó, các đại diện của IBM liên lạc với người điều hành sản xuất chương trình Jeopardy! là Harry Friedman với ý tưởng là muốn đưa Watson vào tranh tài trên chương trình trò chơi này. Kết quả là các nhà sản xuất chương trình đồng ý.[13][16]
Theo một cuộc phòng vấn trên WFDU-FM ngày 14 tháng 2 năm 2011, giọng nói của Watson được chuyển âm từ giọng của nam diễn viên kiêm nhà đọc truyện thâu âm Jeff Woodman qua chương trình phần mềm “chữ thành âm” của IBM.[17]
Vào tháng 2 năm 2010, trên căn bản thông thường thì Watson có thể đánh bại được những người thật tham gia chương trình trò chơi truyền hình Jeopardy!.[18] Trong một phòng hội nghị tại một địa điểm kỹ thuật của mình, công ty IBM đã tạo ra một cuộc chơi giả định giống như cuộc chơi trên chương trình trò chơi Jeopardy! và có cả một số cá nhân người thật tham gia trong đó có những người trước đây đã từng tham gia trò chơi Jeopardy! cùng tham gia vào các buổi tranh tài giả định chống Watson. Todd Alan Crain của The Onion đóng vai trò người điều khiển trò chơi. Watson, được đặt ở một tầng nhà khác, nhận các câu gợi ý điện tử; rồi Watson có thể bấm nút vào để nói bằng giọng điện tử khi nó đưa ra lời giải theo khuôn mẫu câu hỏi của chương trình Jeopardy!.[13]
Watson được bộc lộ bằng hình tượng của một quả địa cầu, lấy sáng tạo độc đáo từ biểu trưng ” hành tinh thông minh hơn ” của IBM, và 42 sợi quấn quanh quả địa cầu để biểu lộ trạng thái tâm lý của Watson. Con số 42 có ý vui nhộn ám chỉ đến ” The Hitchhiker’s Guide to the Galaxy ” ( tiểu thuyết ). [ 19 ]Trong một cuộc thử sức thực tiễn trước báo giới ngày 13 tháng 1 năm 2011, Watson thắng một vòng gồm có 15 câu hỏi trước đối thủ cạnh tranh Ken Jennings và Brad Rutter với số điểm là $ 4.400, Jennings được $ 3.400 và Rutter $ 1.200 mặc dầu Jennings và Watson hòa nhau trước câu hỏi ở đầu cuối trị giá $ 1.000. [ 20 ] Cả hai người thật và Watson đều không vấn đáp đúng câu hỏi sau cuối .
Ban đầu Watson bấm chuông xin trả lời câu hỏi một cách điện tử nhưng chương trình Jeopardy! yêu cầu rằng nó phải thực sự bấm nút như những người thật tham gia trò chơi. Mặc dù dùng 1 ngón tay robot để bấm nút nhưng Watson vẫn nhanh hơn người thật tham gia trò chơi. Jennings ghi nhận rằng “Nếu bạn tìm cách thắng trò chơi này thì cái chuông là tất cả” và rằng Watson “có thể bấm chuông chính xác đến 1 phần triệu giây. Phản xạ của con người không thể nào so sánh được với các mạnh điện tử về khía cạnh này”. Vả lại Watson có thể tránh được lỗi phạt vì bất ngờ bấm chuông quá sớm bởi vì nó được thông báo bằng điện tử khi nào bấm chuông trong khi người thật tham gia trò chơi này phải phán đoán thời điểm thích hợp để bấm chuông.[21][22][23]
Trận đấu tiên phong[sửa|sửa mã nguồn]
Vòng đầu được phát sóng vào ngày 14 tháng 2 năm 2011. Quyền chọn câu hỏi tiên phong được quyết định hành động qua cách bốc thăm và người được quyền chọn câu hỏi tiên phong là Rutter. [ 11 ] Watson vấn đáp đúng cho câu hỏi tiên phong và rồi chọn câu hỏi thứ tư trong thể loại số 1, đây là một kế hoạch thận trọng để tìm ra một thắc mắc ” Daily Double ” ( ” Daily Double ” là câu hỏi mà người chọn được nó có quyền cược giá trị tiền theo ý muốn và vấn đáp ngay mà không cần phải bấm chuông ) nhanh như hoàn toàn có thể. [ 24 ] Như đã xảy ra, Watson đoán đúng vị trí của câu hỏi Daily Double. Vào cuối vòng 1, Watson hòa với Rutter với số tiền $ 5.000 và Jennings đứng hạng 3 với số tiền là $ 2.000. [ 11 ]Tuy nhiên Watson đã không tránh khỏi sai sót vụng về của nó. Trong 1 thời gian, Watson đưa ra câu vấn đáp sai giống tựa như như câu vấn đáp mà Jennings vừa đưa ra. Vì Watson ” điếc ” và không vận dụng mạng lưới hệ thống phân biệt giọng nói nên nó không biết rằng Jennings đã đưa ra câu vấn đáp sai tựa như .Watson dẫn đầu vào vòng 2, vấn đáp đúng cả hai thắc mắc ” Daily Double “. Watson vấn đáp thắc mắc Daily Double thứ hai đúng với tỉ lệ tự tin 32 %. Cuộc chơi kết thúc với Jennings được $ 4.800, Rutter $ 10.400, và Watson $ 35.734. Watson là người chơi duy nhất vấn đáp sai câu hỏi ở đầu cuối trong thể loại thành phố ở Hoa Kỳ ( ” phi trường lớn nhất của thành phố này được đặt tên của một vị anh hùng trong Chiến tranh quốc tế thứ hai, và phi trường lớn thứ hai của thành phố này được đặt tên theo một trận đánh trongChiến tranh quốc tế thứ hai ” ). Chicago là câu vấn đáp đúng ( hai phi trường là Phi trường Quốc tế O’Hare, được đặt tên của thiếu tá Hải quân Hoa Kỳ, Edward ” Butch ” O’Hare, một phi công hải quân tài ba trongChiến tranh quốc tế thứ hai được trao tặng huân chương vinh dự, và phi trường khác là Phi trường Quốc tế Chicago Midway, được đặt tên theo tên của trận Midway ) nhưng câu vấn đáp của Watson là Toronto ? ? ? ? ?, có lẽ rằng chỉ thành phố Toronto của Canada. Các dấu hỏi đi sau câu vấn đáp chứng tỏ rằng Watson không chắc như đinh với câu vấn đáp của mình. Nó chỉ đặt cược số tiền là USD 947 cho câu hỏi sau cuối này. [ 25 ] [ 26 ] Eric Nyberg, giáo sư tại Đại học Carnegie Mellon, người thao tác với đội ngũ tăng trưởng của IBM đặt trách về Watson cho rằng lỗi lầm này xảy ra là vì Watson không có kỹ năng và kiến thức so sánh để vô hiệu câu vấn đáp tiềm năng thành câu vấn đáp không đáng đáng tin cậy. [ 27 ]
Trong vòng 2 có tên “Double Jeopardy!”, Watson tỏ cho thấy một vài điệu bộ Jeopardy! mà người ta thường thấy ở người chơi thật, thí dụ như nó yêu cầu câu hỏi có số tiền mới hơn trong “cùng một thể loại” và tuyên bố rằng “tôi sẽ đoán” trước khi trả lời một câu hỏi thuộc Daily Double mà nó có tự tin thấp. Nó cũng chứng tỏ có một số chiến thuật đặt cược rất lý thú cho các câu hỏi Daily Double. Có câu nó đặt cược $6.435 và câu khác là $1.246.
Trận đấu thứ hai[sửa|sửa mã nguồn]
Trong phần ra mắt, người điều khiển và tinh chỉnh game show Alex Trebek nói đùa rằng ông ta đã được biết rằng Toronto là một thành phố của Hoa Kỳ, và lỗi lầm của Watson trong trận đấu thứ nhất đã khiến cho một kỹ sư của IBM phải mặc một cái áo ngoài của Toronto Blue Jays để đến buổi thu hình của trận đấu thứ hai. [ 28 ]Trong vòng 1, ở đầu cuối Jennings hoàn toàn có thể chọn được 1 câu hỏi Daily Double trong khi Watson vấn đáp sai một câu hỏi Daily Double lần tiên phong trong vòng hai. Sau vòng 1, Watson đứng hạng nhì lần tiên phong trong cuộc tranh tài sau khi Rutter và Jennings có khoảng chừng thời hạn ngắn ngày càng tăng số tiền của mình trước khi Watson hoàn toàn có thể bấm chuông và vấn đáp. Mặc dù vậy, tác dụng sau cuối kết thúc với phần thắng dành cho Watson với số tiến là $ 77.147, vượt mặt Jennings người đang có $ 24.000 và Rutter $ 21.600. [ 29 ]
Giải thưởng cho cuộc tranh tài này là 1 triệu đô là dành cho vị trí thứ nhất (Watson), $300.000 cho vị trí thứ hai (Jennings), và $200.000 cho vị trí thứ ba (Rutter). Như đã hứa, IBM sẽ quyên tặng 100% tiền thưởng của Watson cho từ thiện, trong đó 50% tặng cho World Vision và 50% tặng cho World Community Grid.[30] Tương tự như vậy, Jennings và Rutter sẽ tặng 50% giải thưởng của họ cho hội từ thiện của mình.
Sử dụng trong tương lai[sửa|sửa mã nguồn]
Theo IBM, ” Mục tiêu là đưa những máy điện toán khởi sự tương tác theo ngôn từ con người tự nhiên qua một tầm mức gồm những chương trình ứng dụng và giải quyết và xử lý, để hiểu biết những câu hỏi mà con người hỏi và đưa ra những lời đáp mà con người hoàn toàn có thể hiểu và bào chữa. ” [ 31 ] Những hạn chế tự nhiên hiện hữu trong những buổi chơi hoàn toàn có thể cung ứng một môi trường tự nhiên lý tưởng để tăng trưởng trí tuệ điện toán. [ 32 ]Watson dựa vào những sever IBM Power 750, có bán trên thị trường từ tháng 2 năm 2010. IBM cũng hướng tới việc đưa ra thị trường ứng dụng DeepQA để bán cho những đại công ty với giá khoảng chừng hàng triệu đô la. IBM trông mong là hoàn toàn có thể hạ giá tiền trong thời hạn 1 thập niên khi mà kỹ thuật cãi thiện. [ 13 ]
Liên kết ngoài[sửa|sửa mã nguồn]
Lưu trữ chương trình J ![sửa|sửa mã nguồn]