Dạy xe tự lái nhận biết ngôn ngữ cử chỉ con người

(News.oto-hui.com) – Bằng việc kết hợp công nghệ ghi lại các chuyển động và máy học (machine learning), những mẫu ô tô điện tự lái do Cruise phát triển đã có thể phân biệt tốt các cử chỉ cơ bản của người tham gia giao thông cũng như xử lý khi gặp một số tình huống trên đường hay sự chỉ đạo điều tiết giao thông.

Ngôn ngữ cử chỉ cơ bản con người khi tham gia giao thông

Làn đường bị thu hẹp do sửa chữa, những người công nhân công trình cầm biển báo chỉ dẫn giao thông hay một người chạy xe đạp giơ tay xin đường, tất cả tình huống này cơ bản sẽ không khiến người điều khiển xe khi tham gia giao thông phải suy nghĩ đến lần thứ hai khi lái xe trên đường. Các bác tài trên cung đường hằng ngày còn gặp nhiều tình huống phức tạp hơn. Tuy vậy, những tình huống tưởng chừng như đơn giản với con người sẽ là trở ngại đáng kể khiến những chiếc xe tự lái có thể đứng ì một chỗ, gây cản trở giao thông.

Đương nhiên, để việc điều hướng xe tự lái được suôn sẻ, không gây ảnh hưởng đến tình trạng giao thông đồng nghĩa với việc những chiếc xe này phải trở nên thông minh hơn nữa, có thể hiểu được những hành vi của con người trên các cung đường. Nhiều hãng phát triển xe tự lái trên khắp thế giới những năm gần đây đã không ngừng nghiên cứu giúp sản phẩm của họ có thể hiểu được ngôn ngữ cử chỉ cơ bản của người tham gia giao thông. Cũng không ít hãng chọn ứng dụng cả máy học (machine learning) để giúp những chiếc xe tự lái hiểu hơn về thế giới thực xung quanh nhằm di chuyển an toàn hơn.

MzY3OTc1Mg-750-jpeg.jpg

Sự kết hợp công nghệ ghi lại chuyển động với máy học giúp các kỹ sư đào tạo xe hơi điện tự lái có thể phân biệt các cử chỉ con người

 

Cruise đang xây dựng bộ dữ liệu hành vi con người khi tham gia giao thông

Đáng kể nhất gần đây có thể nói chính là Cruise – hãng xe hơi điện tự lái với số lượng lên đến hàng trăm chiếc từng di chuyển không ngừng trên những cung đường đồi dốc ở San Francisco (Mỹ). Được biết, Cruise từng ứng dụng công nghệ máy học vào những sản phẩm xe hơi điện tự lái của hãng, song họ đã sớm nhận thấy máy học thôi vẫn chưa đủ. Theo Cruise, những chiếc xe công nghệ hoàn toàn không cần đến người lái của hãng sẽ phải đủ thông minh để phân biệt tốt những tình huống khi tham gia giao thông từ mọi góc độ, mọi khoảng cách để ứng phó kịp thời nhằm đảm bảo an toàn cho mọi người trên đường.

Các kỹ sư tại Cruise cho biết đã tìm ra giải pháp giúp lấp đầy khoảng trống từ việc thiếu hụt dữ liệu khi chỉ sử dụng duy nhất phương pháp máy học để “dạy” những chiếc xe tự lái của họ hiểu hành vi con người. Đương nhiên, việc lấp đầy khoảng trống cũng đồng nghĩa với việc Cruise phải xây dựng một bộ dữ liệu hành vi con người khi tham gia giao thông cũng như cả những hướng dẫn di chuyển từ người điều khiển giao thông trên đường. Để việc xây dựng bộ dữ liệu này được hiệu quả, các kỹ sư Cruise đã cực kỳ sáng tạo khi chọn thuê các nhà phát triển game (vốn có khả năng tạo ra các nhân vật chuyển động) và dùng kỹ thuật ghi lại chuyển động con người (motion capture hay mo-cap) để số hóa các cử chỉ, hành vi của con người khi tham gia giao thông.

Đầu tiên, các kỹ sư tại Cruise tiến hành lên một danh sách những cách mà con người dùng chuyển động cơ thể để tương tác với người khác trong cuộc sống hằng ngày. Đơn cử như khi một người vẫy taxi, nói chuyện điện thoại khi đang di chuyển trên đường, hay cách họ di chuyển xuống lòng đường để tránh các công trình vỉa hè. Các kỹ sư dày dạn kinh nghiệm này cũng bắt đầu với những chuyển động mà một chiếc xe tự hành có thể hiểu sai về mệnh lệnh ví dụ như khi người đi bộ đó vẫy tay với một người bạn. Các cử chỉ được thực hiện gần xe tự lái nhưng không nhằm vào nó, chẳng hạn như nhân viên bãi đậu xe vẫy xe ở làn bên cạnh khi xe vào gara, hay công nhân xây dựng giơ biển yêu cầu xe dừng tạm thời cũng được đưa vào bộ dữ liệu ban đầu. Chưa dừng lại ở đây, danh sách hành vi này còn được bao gồm cả những thông điệp cơ bản như yêu cầu dừng/chạy, rẽ trái/phải và một thông điệp “trắng” dành cho những chuyển động phổ biến không liên quan đến việc vượt xe như chụp ảnh tự sướng hay một người bỏ ba lô khỏi vai.

Lẽ đương nhiên, các cử chỉ mà con người dùng để truyền tải thông điệp sẽ phải có tính đồng nhất. Vì vậy, các kỹ sư hiểu rằng bộ dữ liệu của hãng sẽ không chỉ dừng lại ở mức 5 hành vi như ví dụ ban đầu và tương lai con số này sẽ tăng lên bao nhiêu cũng chưa thể nào đưa ra một con số chính xác.

MzY3OTc2NQ-jpeg.jpg

Xe tự lái của Cruise có thể di chuyển an toàn trong các khu vực thi công trên đường

Như đã đề cập, việc xây dựng một bộ dữ liệu cần phải kết hợp sử dụng cả công nghệ ghi lại các chuyển động của con người. Để ghi lại các chuyển động một cách chính xác, các kỹ sư chọn giải pháp dùng hệ thống mo-cap trang bị các cảm biến thay cho hệ thống quang học vốn cần đến nhiều camera phức tạp và môi trường ánh sáng cần được chuẩn bị, tính toán kỹ càng như trong studio. Theo các kỹ sư Cruise, hệ thống ghi lại các chuyển động dùng cảm biến ít phức tạp hơn về mặt thiết lập, dễ dàng di chuyển, không cần điều kiện ánh sáng hoàn hảo và cũng kết nối hoàn toàn không dây.

Các kỹ sư Cruise thiết kế một bộ áo mo-cap dựa theo mô hình trên trong đó sử dụng 19 “gói” cảm biến được bố trí ở những vị trí chính trên cơ thể người như đầu, ngực, hông, vai, cánh tay trên, cẳng tay và chân. Mỗi “gói” cảm biến này có kích cỡ chỉ bằng một đồng xu trong đó bao gồm các loại thiết yếu như gia tốc kế, con quay hồi chuyển và từ kế. Tất cả cảm biến được kết nối với một thắt lưng tích hợp pin, hệ thống điều khiển và bộ truyền tín hiệu không dây (Wi-Fi). Dữ liệu thu được từ các cảm biến này sẽ được truyền liên tục đến một chiếc laptop chạy phần mềm chuyên dụng cho phép các kỹ sư của Cruise xem và đánh giá dữ liệu trong thời gian thực.

Để tiến hành thu thập dữ liệu, các kỹ sư đã tuyển 5 tình nguyện viên có đặc điểm cơ thể khác nhau và khác nhau cả về giới tính mặc những bộ trang phục đặc biệt trên. Các diễn viên tình nguyện này sẽ thực hiện các động tác mà kỹ sư của Cruise làm mẫu để hiệu chỉnh hệ thống mo-cap. Sau khi hiệu chỉnh thành công, mỗi diễn viên trong bộ áo mo-cap sẽ thực hiện từng cử chỉ khác nhau theo danh sách những cử chỉ mà nhóm kỹ sư đã tạo ra nhằm mô phỏng ngôn ngữ cơ thể trong thế giới thực.

Trong suốt 7 ngày, những diễn viên này sẽ phải thực hiện lặp đi lặp lại các động tác sử dụng từng tay riêng biệt và trong một số trường hợp kết hợp cả hai tay. Đương nhiên, nhóm kỹ sư cũng yêu cầu những diễn viên thực hiện động tác với cường độ khác nhau để mô phỏng cử chỉ báo hiệu dừng khẩn cấp đối với một chiếc ô tô đang di chuyển nhanh trong khu vực xây dựng. Những động tác cường độ thấp sẽ được ứng dụng trong mô phỏng tình huống cho thấy xe hơi nên giảm tốc độ một cách từ từ. Cruise cho biết, bước đầu nhóm thu được kết quả 239 đoạn clip mỗi đoạn có thời lượng 30 giây.

Trước khi đưa lượng dữ liệu thu được từ bước trên vào mô hình máy học, các kỹ sư cũng phải đảm bảo chắc chắn rằng tất cả chuyển động thu được đều không bị nhiễu bởi các yếu tố tác động nào và đương nhiên cũng không có bất kỳ cảm biến xoay nào cung cấp dữ liệu sai. Một khi quá trình này được đảm bảo, các kỹ sư chạy từng chuỗi cử chỉ thông qua phần mềm xác định vị trí khớp và hướng của từng khung hình trong chuỗi.

Bởi vì những vị trí này ban đầu được chụp trong không gian 3D, phần mềm có thể tính toán nhiều phối cảnh 2D của mỗi chuỗi cho phép các kỹ sư mở rộng bộ cử chỉ bằng cách xoay từng bước các điểm để mô phỏng 10 góc nhìn khác nhau. Các kỹ sư Cruise cho biết cũng đã tạo ra nhiều biến thể hơn nữa bằng cách đặt ngẫu nhiên các điểm khác nhau của cơ thể nhằm mô phỏng các tình huống trong thế giới thực, trong đó có cả trường hợp các điểm ngoài tầm nhìn để xoay dần các điểm còn lại, tạo ra các góc nhìn khác nhau.

Từ quá trình nghiên cứu thử nghiệm, hệ thống mo-cap còn mang đến cho các kỹ sư một dữ liệu rõ ràng là cấu trúc xương của các tư thế con người là nhất quán bất kể kiểu dáng hoặc màu sắc quần áo hoặc điều kiện ánh sáng ra sao. Chính lượng dữ liệu sạch này cho phép họ đào tạo hệ thống máy học hiệu quả hơn nữa. Việc huấn luyện những chiếc xe thông minh từ hệ thống mo-cap này giúp các kỹ sư tin rằng những chiếc xe tự lái của hãng sẽ có khả năng điều hướng tốt hơn trong tình trạng giao thông hiện tại. Cruise tự tin những chiếc xe tự lái của hãng có thể di chuyển an toàn xung quanh nhiều công nhân của những công trình xây dựng đường phố nhờ khả năng hiểu rõ những cử chỉ tay tương ứng của họ.

Dẫu vậy, các kỹ sư cho biết việc đào tạo những chiếc xe hơi tự lái của hãng hiểu được các cử chỉ con người vẫn chỉ là bước khởi đầu. Hãng này vẫn đang tiếp tục thử nghiệm hệ thống phát hiện chuyển động thông qua những video thu thập từ xe thử nghiệm khi di chuyển thực tế. Cruise cho biết cũng đang tiến hành đào tạo cho hệ thống của hãng khả năng hiểu được khái niệm con người mang vác hay đẩy một vật thể khác, chẳng hạn như xe đạp. Vì cơ bản, hoạt động của một người đi xe đạp hoàn toàn khác biệt với cách mà họ dắt hay đẩy bộ chiếc xe của mình.

Các kỹ sư của Cruise cũng đang có kế hoạch mở rộng tập dữ liệu hành vi để giúp ô tô hiểu rõ hơn về cử chỉ của người đi xe đạp. Những chiếc xe của Cruise đã có thể nhận ra người đi xe đạp và tự động giảm tốc độ để nhường đường cho họ. Tuy nhiên, biết được cử chỉ của người đi xe đạp sẽ cho phép xe của hãng đảm bảo rằng đã cung cấp đủ phần đường cho người đi xe đạp để thực hiện động tác có tín hiệu mà không phải dừng hẳn, gây tắc đường không cần thiết. Tất nhiên, xe tự lái của Cruise sẽ vẫn chú ý đến những cú rẽ bất ngờ từ người đi xe đạp không báo hiệu ý định của họ.

Xe tự lái sẽ thay đổi cách mà con người sống trong những năm tới đây và máy học đã giúp chúng ta đi một chặng đường dài trong quá trình phát triển này. Các kỹ sư của Cruise tin rằng, việc sử dụng sáng tạo các công nghệ như ghi lại chuyển động sẽ cho phép hãng nhanh chóng huấn luyện đội xe tự lái của mình cùng tồn tại tốt hơn trong các thành phố và mang lại sự an toàn cho tất cả mọi người.

QL – doanhnhansaigon


Bài viết liên quan:

Bạn cũng có thể thích Bài đăng cùng tác giả

Chia sẻ ý kiến của bạn

Thông Tin Cá Nhân

NamNữ

Trình Độ Học Vấn

Thông tin chung