Gene Daud_2034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daud_2034
Symbol
ID	6025846
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Desulforudis audaxviator MP104C
Kingdom	Bacteria
Replicon accession	NC_010424
Strand	-
Start bp	2141960
End bp	2143120
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	63%
IMG OID	641594855
Product	major facilitator transporter
Protein accession	YP_001718156
Protein GI	169832174
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCGGTCGA CTTGGCTGGA CCAGGGCCTG ATTCTGTTAT TCACCGGGTC CTTCATGGTT 
TTTGTGAACC TGCACCTGGC GTTCATCATA ATGCCCCTGT ATGTGCTCGA ACTGGGGGGC 
GGCGACTGGA CGGCGGCCTG GTACAATACC CTTCTGGCCG GAGCGGCGGT GCTGTTCCGG 
TTTCTTTTCG CTTCCTGGGT GGACCGGTTC GGGCGCAAGT TTTCCCTGCT GGTGAGCGGA 
TCGGCCCTGG TGACCGCGCC GCTGTTTATT CTGCTGGCCG GTTCGCCGGC CTATTTGTCG 
TTCATTCGTG TGTTCCAGGC CCTGGGCCTG GCGCTCTACC CGCTGGCCGC GAACACCCTG 
ATCGCCGACC TAAGTCCGGT GGCGCGGCGT GGGACCGTCC TGGGCCTGCA GCGGTTGATC 
ATTATCACCG CCCTCATCAC TGGGCCGCCC GTGGCGGTCC TGATTGTCGA GCAGTACGGA 
TTCCAGACCC TGTTTTGGTT GCTTACCATT CTGGGGCTCG CCGGGATGGC GCCGCTCCTG 
GCCATTCGCG AACCGGTGCG CGCCGGAACC GGGACTCCGG TTCTGAACGG GTTTCAGTTC 
GTTCTTGCCT CCCGTCCGCT GCGCGTGTTG ATCTCGTCGA CGGCCGCCTG CGGCCTGGCC 
TACGGTGTAC TGCTCACCTT TCTCCCTTTG TACGCGGTGC GCGTGGGAAT CGACAATTTC 
GGCCTCTATT TCACTGTGTT TGCTTTCAGC GGCCTTGTTT CGGGGGTGGT TGCCGGGCGC 
CTGTCCGACG CCTTCGGCCG CCGCAAAGTG CTGGTGCCGT CGCTGGCCCT TTTCGGCATG 
GGCATTCTGT ATCTCGGCCT CCCGGCGCCG GGAGCGGTAA TGATGGTCAG CGCCGTGGTG 
GCCGGTATCG GCTACTCGGC CTCACTCACC CTGCTGGTCG CCTGGGTGGT GGATGCGGCC 
GGCCGTAAGC TGCGCGCGGC TTCCCTGGGT CTTTTTGAAA ACGGGATCGA CGTGGGGATT 
ACCGCGGGCT CTTTTGCGTT TGGGAGTGTG GTCGCCCTGC TGGGTTTCGG GTTCGCTTTT 
TCCACCGCCG GCGCGCTGCT GCTGATATTC GCGGTCCTGA TCGCCACCCT GGACCGGGGC 
CCCGTTTCCC AAATCCGTTA G

Protein sequence

MRSTWLDQGL ILLFTGSFMV FVNLHLAFII MPLYVLELGG GDWTAAWYNT LLAGAAVLFR 
FLFASWVDRF GRKFSLLVSG SALVTAPLFI LLAGSPAYLS FIRVFQALGL ALYPLAANTL 
IADLSPVARR GTVLGLQRLI IITALITGPP VAVLIVEQYG FQTLFWLLTI LGLAGMAPLL 
AIREPVRAGT GTPVLNGFQF VLASRPLRVL ISSTAACGLA YGVLLTFLPL YAVRVGIDNF 
GLYFTVFAFS GLVSGVVAGR LSDAFGRRKV LVPSLALFGM GILYLGLPAP GAVMMVSAVV 
AGIGYSASLT LLVAWVVDAA GRKLRAASLG LFENGIDVGI TAGSFAFGSV VALLGFGFAF 
STAGALLLIF AVLIATLDRG PVSQIR