Facebook sử dụng 3,5 tỉ ảnh Instagram để cải thiện AI nhận diện khuôn mặt

Facebook đã cải thiện khả năng AI của mình trong việc phân loại các đối tượng trong ảnh nhờ dữ liệu từ 3,5 tỉ bức ảnh Instagram.


Gã khổng lồ mạng xã hội đã tiết lộ dự án thu thập dữ liệu hình ảnh mới nhất cho AI tại sự kiện Hội nghị các nhà phát triển hàng năm F8 ở San Jose. Giám đốc công nghệ Mike Schroepfer giải thích về những thách thức của việc cải thiện độ chính xác của máy tính để nó hiểu các đối tượng trong ảnh. Một trong những vấn đề lớn nhất của công ty là không có đủ hình ảnh được gắn đúng cách để đào tạo AI hiểu những gì có trong đó.


Ví dụ, trước khi AI có thể hiểu một quả táo trong một bức ảnh thực sự là một quả táo, nó cần được “đào tạo” trên các bức ảnh trước đó về quả táo mà con người gắn chính xác với đúng loại trái cây.


Bằng việc sở hữu dịch vụ chia sẻ ảnh Instagram phổ biến, Facebook sẽ muốn sử dụng tất cả dữ liệu hình ảnh của Instagram, được chụp từ những bức ảnh mà mọi người tải lên. Sau đó, nó có thể sử dụng những ảnh đó để cải thiện khả năng nhận dạng hình ảnh tổng thể.


Schroepfer cho biết Facebook đã lấy dữ liệu của 3,5 tỉ bức ảnh Instagram, được gắn thẻ # để mô tả chúng, từ đó có thể “tạo ra kết quả hiện đại” dựa trên tiêu chuẩn ImageNet phổ biến - vốn được các nhà nghiên cứu AI sử dụng làm thước đo hiệu quả của dự án so với những sản phẩm khác.


Trong một cuộc phỏng vấn với tạp chí Fortune trước F8, Giám đốc ứng dụng máy tính Manohar Paluri nói rằng một trong những thách thức trong việc đào tạo AI của công ty là nhiều bức ảnh trên Instagram có hashtag linh tinh, nghĩa là ai đó đã mô tả một bức ảnh của một con chó nhưng thực tế là loại khác, và điều này xảy ra ở khắp mọi nơi trên Instagram.


Một khi máy học có thể phân tích hàng tỉ bức ảnh, Facebook sau đó về cơ bản đã sở hữu một cơ sở dữ liệu nhận diện phổ biến cho ngôn ngữ tiếng Anh gọi là WordNet.


Ảnh Công cụ nhận diện khuôn mặt của Facebook đang ngày càng được cải thiện.

Trong một bài nghiên cứu về dự án, các nhà nghiên cứu Facebook nói rằng bằng cách sử dụng WordNet, công ty đã có thể nhóm các thẻ hashtag với nhau để loại bỏ những thứ linh tinh. Kết quả là Paluri nói rằng máy học của Facebook giờ đây có thể phân biệt giữa các loài chim cụ thể trong ảnh cũng như các điều kiện thời tiết khác nhau trong những bức ảnh đó. Hiện nay, hệ thống này có thể cho biết sự khác biệt giữa các loại động vật khác nhau, loại thực phẩm phổ biến…


Facebook tiết lộ, toàn bộ dự án AI mất 22 ngày và yêu cầu sức mạnh của 330 bộ xử lí đồ họa để gây dựng một hệ thống máy học tốt nhất có thể. Paluri nói rằng với khả năng hiểu rõ hơn về hình ảnh, Facebook sẽ có thể tạo ra các mô tả âm thanh chính xác hơn cho người dùng khiếm thị. “Thành thật mà nói đây mới chỉ là sự khởi đầu. Chúng tôi đang bắt đầu học từ dữ liệu này”, Paluri cho biết.


Với Schroepfer, những cải tiến nhận dạng hình ảnh AI mới đã được đưa vào các sản phẩm Facebook khác nhau.


Theo Dân Việt.









Facebook su dung 3,5 ti anh Instagram de cai thien AI nhan dien khuon mat


Facebook da cai thien kha nang AI cua minh trong viec phan loai cac doi tuong trong anh nho du lieu tu 3,5 ti buc anh Instagram.


Ga khong lo mang xa hoi da tiet lo du an thu thap du lieu hinh anh moi nhat cho AI tai su kien Hoi nghi cac nha phat trien hang nam F8 o San Jose. Giam doc cong nghe Mike Schroepfer giai thich ve nhung thach thuc cua viec cai thien do chinh xac cua may tinh de no hieu cac doi tuong trong anh. Mot trong nhung van de lon nhat cua cong ty la khong co du hinh anh duoc gan dung cach de dao tao AI hieu nhung gi co trong do.


Vi du, truoc khi AI co the hieu mot qua tao trong mot buc anh thuc su la mot qua tao, no can duoc “dao tao” tren cac buc anh truoc do ve qua tao ma con nguoi gan chinh xac voi dung loai trai cay.


Bang viec so huu dich vu chia se anh Instagram pho bien, Facebook se muon su dung tat ca du lieu hinh anh cua Instagram, duoc chup tu nhung buc anh ma moi nguoi tai len. Sau do, no co the su dung nhung anh do de cai thien kha nang nhan dang hinh anh tong the.


Schroepfer cho biet Facebook da lay du lieu cua 3,5 ti buc anh Instagram, duoc gan the # de mo ta chung, tu do co the “tao ra ket qua hien dai” dua tren tieu chuan ImageNet pho bien - von duoc cac nha nghien cuu AI su dung lam thuoc do hieu qua cua du an so voi nhung san pham khac.


Trong mot cuoc phong van voi tap chi Fortune truoc F8, Giam doc ung dung may tinh Manohar Paluri noi rang mot trong nhung thach thuc trong viec dao tao AI cua cong ty la nhieu buc anh tren Instagram co hashtag linh tinh, nghia la ai do da mo ta mot buc anh cua mot con cho nhung thuc te la loai khac, va dieu nay xay ra o khap moi noi tren Instagram.


Mot khi may hoc co the phan tich hang ti buc anh, Facebook sau do ve co ban da so huu mot co so du lieu nhan dien pho bien cho ngon ngu tieng Anh goi la WordNet.


Anh Cong cu nhan dien khuon mat cua Facebook dang ngay cang duoc cai thien.

Trong mot bai nghien cuu ve du an, cac nha nghien cuu Facebook noi rang bang cach su dung WordNet, cong ty da co the nhom cac the hashtag voi nhau de loai bo nhung thu linh tinh. Ket qua la Paluri noi rang may hoc cua Facebook gio day co the phan biet giua cac loai chim cu the trong anh cung nhu cac dieu kien thoi tiet khac nhau trong nhung buc anh do. Hien nay, he thong nay co the cho biet su khac biet giua cac loai dong vat khac nhau, loai thuc pham pho bien…


Facebook tiet lo, toan bo du an AI mat 22 ngay va yeu cau suc manh cua 330 bo xu li do hoa de gay dung mot he thong may hoc tot nhat co the. Paluri noi rang voi kha nang hieu ro hon ve hinh anh, Facebook se co the tao ra cac mo ta am thanh chinh xac hon cho nguoi dung khiem thi. “Thanh that ma noi day moi chi la su khoi dau. Chung toi dang bat dau hoc tu du lieu nay”, Paluri cho biet.


Voi Schroepfer, nhung cai tien nhan dang hinh anh AI moi da duoc dua vao cac san pham Facebook khac nhau.


Theo Dan Viet.


Facebook sử dụng 3,5 tỉ ảnh Instagram để cải thiện AI nhận diện khuôn mặt

Facebook đã cải thiện khả năng AI của mình trong việc phân loại các đối tượng trong ảnh nhờ dữ liệu từ 3,5 tỉ bức ảnh Instagram.
Giới thiệu cho bạn bè
  • gplus
  • pinterest

Bình luận

Đăng bình luận

Đánh giá