请教下,用R读取txt文件内容,是不规则的代码,若用read.table就错误,因为每一行有几列是不确定的 那可以用什么函数读取?

0

1.jpg

 
已邀请:
0

dj123jary 2016-08-17 回答

你这个是xml格式的txt,R语言专门有处理XML文件的包XML
> library(XML)

> tt =
+   '<x>
+ <a>text</a>
+ <b foo="1"/>
+ <c bar="me">
+ <d>a phrase</d>
+ </c>
+ </x>'
> tt
[1] "<x>\n<a>text</a>\n<b foo=\"1\"/>\n<c bar=\"me\">\n<d>a phrase</d>\n</c>\n</x>"
> doc = xmlParse(tt)
> xmlToList(doc)
$a
[1] "text"

$b
foo 
"1" 

$c
$c$d
[1] "a phrase"

$c$.attrs
 bar 
"me" 


> doc = xmlTreeParse(tt)
> xmlToList(doc)
$a
[1] "text"

$b
foo 
"1" 

$c
$c$d
[1] "a phrase"

$c$.attrs
 bar 
"me" 
> xmlToDataFrame(tt)
  text        d
1 text     <NA>
2 <NA>     <NA>
3 <NA> a phrase
 
 

要回复问题请先登录注册