Gene Rxyl_3029 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rxyl_3029
Symbol
ID	4115965
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rubrobacter xylanophilus DSM 9941
Kingdom	Bacteria
Replicon accession	NC_008148
Strand	-
Start bp	3036923
End bp	3038053
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	66%
IMG OID	638037799
Product	major facilitator transporter
Protein accession	YP_645751
Protein GI	108805814
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.000550731
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCGTC CGATGGCTTT CGTCCTGCTG GCGGCGCTTG GCACCTTCAC TAACGTCAAC 
CTACTCTTGC CCGTCATGCC TCTCTACGTG GCAAGATCCG GTGCGGGAGA TTTCTTTGCG 
GGGCTTGCGA CAACGGCCCT GTTGCTTACC ACGGTCGTCG CGCAGATAGG GACGCCGCGC 
GTGCTGGGCC GGTGCGGGTA CTCCTCAACC CTGATAGCAG GTATGGTCCT CCTCGGGGTC 
CCGTCCGCGT TCTACGTGTG GACGGATGCG GCCGTCCCGT TGCTCGGGAT CACGCTGGTG 
CGCGGACTGG GCTTTGGTGT CGCGACGGTG GCCTTCGCGG CACTGGTTAC AGACCTCTCC 
CCACCGGAGA GGCGCGGTGA GGGGATCGGA CTGTACGGCG TCGCATCCAC GCTCCCGGCC 
GTCTTCGGCC TTCCGCTCGG CCTGTGGCTG GTGAACTGGC TCGGCTACGA GACCGTCTTT 
CTGGCTGGCG CTGCCGGCTG TGTTGTCGGG GTCGCCGGGG TGCTGGCCGC ACGGGTCAAT 
GCAGTGGACC CGCCAGACGG CTCGGCCGGC TTTGTCGCGG GGATGCGCCG CTCCTCCCTG 
CGGCGGCCGC TTTTTGCCTT TGTTTCGACC ACCGTTGCAG CGGGGGTCCT GGTTACGTTC 
CTTCCGCTCG CCTCTCCGGG TTCGGGTTTG GACTCCGCCG CGACCGCGCT CCTGCTCTGG 
GGTTTGGTGC AGACAGCTGC AAGATGGTGG GCTGGACGCG CCACCGACCG CTCCGGAGCA 
GAGCGACTGA TACAGCTCTC CCTGGTCCTG AGCGGCCTCG GCATGCTGGC CGTGAGCCTG 
CCGGAGAACC CCGTCATGCT CCTCACCGGC GCTGTCCTGA ACGGTGTGGG CTTCGGGGTT 
CTCCAGAATG CCACTCTCTC CGTACTCACA GACCGCGTCC CGCGCTCCGA GTACGGTATG 
ATCAGCACCC TCTGGAACGT CGGCTTCGAC GCCGGAGCCG GAGCCAGTCC GCTCGTCTTC 
GGCCTTATTG CCGCGGGCGC CGGATACCCT TTTGCCTTCG CTGCGACCGC TGCTCTCATC 
TTCGCCTCCC TGGTATTTGC CCGCCCCGAT GCTGTAGAGA ATAAAACGTA G

Protein sequence

MSRPMAFVLL AALGTFTNVN LLLPVMPLYV ARSGAGDFFA GLATTALLLT TVVAQIGTPR 
VLGRCGYSST LIAGMVLLGV PSAFYVWTDA AVPLLGITLV RGLGFGVATV AFAALVTDLS 
PPERRGEGIG LYGVASTLPA VFGLPLGLWL VNWLGYETVF LAGAAGCVVG VAGVLAARVN 
AVDPPDGSAG FVAGMRRSSL RRPLFAFVST TVAAGVLVTF LPLASPGSGL DSAATALLLW 
GLVQTAARWW AGRATDRSGA ERLIQLSLVL SGLGMLAVSL PENPVMLLTG AVLNGVGFGV 
LQNATLSVLT DRVPRSEYGM ISTLWNVGFD AGAGASPLVF GLIAAGAGYP FAFAATAALI 
FASLVFARPD AVENKT