Dataset Viewer:高性能数据集查看器,支持100GB+文件流式传输与闪电搜索

  • 享乐分享享乐分享[私信Ta]
  • 3月前
  • 136
  • 阅读3分钟
  • 软件介绍

    一款现代化高性能数据集查看器,基于 Tauri + React + TypeScript 构建。专为处理海量数据集而设计,支持多种数据源,可流式处理 100GB+ 大文件,具备闪电般的搜索能力。

    功能介绍

    🚀 核心特性
    ⚡ 超大文件秒开:100GB+ 文件虚拟化渲染,无需等待加载
    🔍 毫秒级检索:实时搜索,高亮显示,支持大文件快速定位
    📦 压缩包直接预览:ZIP/TAR 文件流式浏览,无需解压即可查看内容
    🗂️ 多格式原生支持:Parquet、Excel、CSV 优化渲染,JSON/YAML 语法高亮
    🌐 多源数据接入:WebDAV、本地文件、云存储(OSS)、HuggingFace 数据集
    🎨 现代化界面:深色/浅色主题,响应式设计,多语言支持

    📚 支持的文件类型
    📄 文本代码:纯文本、JSON、YAML、XML、JavaScript、Python、Java、C/C++、Rust、Go、PHP 等
    📝 文档格式:Markdown(渲染预览)、Word 文档(.docx/.rtf,文本提取)、PowerPoint 演示文稿(.pptx,幻灯片预览)、PDF(查看器,支持文本搜索)
    📦 压缩包:ZIP、TAR(流式预览,无需解压)
    📊 数据文件:Parquet(优化支持)、Excel、CSV、ODS,支持百万行虚拟滚动
    📱 媒体文件:图片、视频、音频(预览支持)

    使用方法/界面展示

    软件默认界面截图如下:
    Dataset Viewer:高性能数据集查看器,支持100GB+文件流式传输与闪电搜索-享乐分享

    通过这个界面,你可以选择通过何种方式查看数据库文件,我个人测试的是本地进行查看。

    测试发现载入数据的速度确实是很快,搜索内容的速度也符合其宣传的效率,但是还是发现一些小问题,比如某一行的数据很长的情况下,搜索关键词,定位可能会出现偏差,无法显示到含有关键词的位置。

    功能展示方面直接使用官方提供的几个截图,大差不差的效果:

    额外补充

    这个软件真的就是一个查看器,除了查看功能之外没有别的功能了,其次其搜索和加载速度快的原因可能是因为其流式加载,而不是一次性加载完,能支持100GB+文件大概率也是这个原因。

    换句话说,最开始可能只加载整体的1%,如果你需要完全加载,就需要不停的玩下滚动或者通过手动跳转到某个节点之后往下查看,但经过测试,这种方式似乎也有问题。

    经过测试,默认显示1%,我手动跳到了99%,继续往下滚动可以正常显示,但是往上滚动似乎就卡住了,怎么都滚动不上去了,不知道是不是一个BUG。

    总而言之,该软件可能还是需要不断调整,如果用来看体积偏小的数据库会非常效率,体积大点的,可能就不那么实用了。

  • 0
  • 0
  • Dataset Viewer:高性能数据集查看器,支持100GB+文件流式传输与闪电搜索
  • 发表评论

    发表
    Dataset Viewer:高性能数据集查看器,支持100GB+文件流式传输与闪电搜索
  • 评分:
  • 平台:5  6
  • 类型:文件查看器
  • 专题:Github
  • 项目介绍:
  • stardustai dataset-viewer
  • 605 41
  • 创建:4月前 更新:1天前
  • A sleek dataset viewer built entirely by AI Agent. Supports streaming large files from WebDAV, S3, Local or Hugging Face. - stardustai/dataset-viewer
  • *数据缓存于:6小时前
  • 大家在看

  • 站点
  • 软件
  • 技巧
  • 上升前十

  • 站点
  • 软件
  • 技巧
  • 订阅我们

    输入你的电子邮件地址订阅网站,我们会在有必要时通过邮件联系您
    订阅
    *订阅成功后会收到订阅通知
    微信公众号:xiangleshare
    三天内不显示