Gene Rxyl_1907 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rxyl_1907
Symbol
ID	4115582
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rubrobacter xylanophilus DSM 9941
Kingdom	Bacteria
Replicon accession	NC_008148
Strand	-
Start bp	1930754
End bp	1932118
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	56%
IMG OID	638036692
Product	general substrate transporter
Protein accession	YP_644666
Protein GI	108804729
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0522136
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGAATCAC GAGAACAAGT AGTGCCGCAG GTAGATCCAG CGCTTATACG CAGGAGCATT 
ATCGGCGGCG CAGTAGGCGT TTGGGTGCAC TGGTTCGACT GGGCGGTCTA CGCCTACTTG 
GCGACTACAC TCGCAGCTGT TTTCTTCCCC AATGAAAACC CCACAGCTGG CCTGCTCTCC 
GTCTTCGCGA TCTTTGCTGT GTCGTTTGTC GTGCGGCCCT TGGGGGGATT CTTCTTCGGA 
CCTTTGGGTG ACAAGATCGG AAGGCGGACC ACTTTAGCTG TGGTTATCAT TACCATGGGG 
GCCGCCACCA CTGCAGTTGG TCTCTTGCCG ACCTACTCCT CGGTGGGCAT CCTGGCACCG 
ATCCTACTTG TCACTGTGCG GCTCGTGCAG GGATTTGCTG CGGGAGGCGA GTTTGGAGGC 
GCTGCTGCGT TTCTCGCGGA GTATTCGCCG AGAAGGCACA GGGGATTCGG GGTTAGTTGG 
CTAGAGAGCT CAAGCCTCCT TGGATTCCTG ACGGCTTCCC TGGCAGTGTT TCTGCTAAAC 
TCCGCCCTTA CGGAGGAGGC TGTGACTGCC TGGGGCTGGC GCATCCCCTT CTTGATCGCG 
GGCCCTATGG CCGTTGTCGG GCTTTACATA CGACTAAAAC TCGAAGACAC CCCCAATTTC 
AGGGTCCTGG AACAAACTAA CGAGGTTTCC CAAGCTCCCC TCCGAGAGCT GTTAAGGCAG 
GACTGGAAAC AACTTCTCCA GATGACAGGG ATCGAGATTC TGCAGCACGT CAGCTTCTAC 
ATTGTCTTAG TTTATCTACT TACCTACCAA ACGCAAGAGT TGGGTCTCTC GTCTGGATCC 
GCTGCCATGC TCTCCACGAT CACCTCAATA GTAGCAATGG TTCTCGTCCC ACTCTTTGGT 
GCTCTCTCCG ACCGTGTCGG TCGAAAGCCC CTATTGATAG CGTCAGGCTT GGGGTTTTTG 
CTACTTTCCT ACCCTGCCTT TCTTCTCATG AGAACAGGCG ACTTGGGGGC CATTATCCTA 
GTGCAGACGG GGCTTGGCAT TCTGCTGGCG CTCATCCTAA GTACGCATGC TGTCGCCATG 
AGCGAGATTT TCCCCACGCG GGTGCGTCAA GCAGGTCTCT CACTCGGCTA TCAGGTGACC 
GCCGCGATTT TCGCAGGAAC CGTACCGTAC CTGATGACGT ACTTGATCTC TGCGACTGGG 
AATCCTTATG TACCGGCCTT TTACCTAATG TTTGTGGGCT TGGTGGGTGT CGGCACCACT 
CTCACGCTGA GAGAAACCGC AGGCCTTCCC TTACCACAGA GAGAGCCTGT TACACCAGTA 
CAGGAAACTG CCGGAGGTGC AGTTTCGGGT TCAGAGTCCG AGTAG

Protein sequence

MESREQVVPQ VDPALIRRSI IGGAVGVWVH WFDWAVYAYL ATTLAAVFFP NENPTAGLLS 
VFAIFAVSFV VRPLGGFFFG PLGDKIGRRT TLAVVIITMG AATTAVGLLP TYSSVGILAP 
ILLVTVRLVQ GFAAGGEFGG AAAFLAEYSP RRHRGFGVSW LESSSLLGFL TASLAVFLLN 
SALTEEAVTA WGWRIPFLIA GPMAVVGLYI RLKLEDTPNF RVLEQTNEVS QAPLRELLRQ 
DWKQLLQMTG IEILQHVSFY IVLVYLLTYQ TQELGLSSGS AAMLSTITSI VAMVLVPLFG 
ALSDRVGRKP LLIASGLGFL LLSYPAFLLM RTGDLGAIIL VQTGLGILLA LILSTHAVAM 
SEIFPTRVRQ AGLSLGYQVT AAIFAGTVPY LMTYLISATG NPYVPAFYLM FVGLVGVGTT 
LTLRETAGLP LPQREPVTPV QETAGGAVSG SESE