Gene Dgeo_2304 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dgeo_2304
Symbol
ID	4059251
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Deinococcus geothermalis DSM 11300
Kingdom	Bacteria
Replicon accession	NC_008025
Strand	+
Start bp	2422606
End bp	2423793
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	73%
IMG OID	641231352
Product	major facilitator transporter
Protein accession	YP_605765
Protein GI	94986401
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGTGGA CCCGGCCCCT GGTGATGCTG CGCTTGCTGG CCCTGCTGCT CACAAGCGAA 
CTGGTCCGCA CCGGCTTTTT CGTCTCTGCG CTGCCGGTGG CGGGGCCAGG GCTGGGGCTG 
GGGACGGCGG TGATCGGCCT GATGGTCGGG GCCCACTACC TCGCGGACGC GCTGGCCAAG 
GGGCCGATGG GCCTGGTGAC CGAGCGCTGG GGGCTGGGGC GGGTGCTGGC CTTGGGGTCG 
GCGCTGGGGC TGACGGCAGT GTTGGGCGCG CGCCTGGCTC CGTCGCCCGC TTGGGGCGTG 
CTGGGCTGTG CCCTCTGGGG CGTGGCCTAC GCGGCGCTGT GGCCGGGCGT GATGAACACC 
TCGCAGGTGC TGGCGCGGCC CGGTCACATC GCGCGGGCAC TGACCCTCTC CAGCCTGAGT 
GTGGCGCCCG CCATCCTGGG CGGCGTGCTG GGGGTGGGGC CGCTGATGCA GGCACACCCC 
GGGGCAGCCT GGGCGCTGCT GGCCGGGGTG CAGGGCGCAG CGCTGCTGTT GGCGCTCAGT 
CTTGTGAGGT TGCACCTGCC CGGCACGGGG GTGCCAAGCG GAAGCGTGTG GCAGGGTTGG 
GCACGGGTGG CGGTGCTGCT GCCTGCTGCC TTCGCGCAGA CACTGGCACC GGGGCTCCTC 
GTCACCCTGT TCTACCCGCT GCTCTCCAGG CTGGGGCTGG GGCTGGGCGA CCTGATCGGG 
CCGGGGCTGC TGGCGCTGGC CGCCTTCGGG GTGTGCCTGT GGGGGGCGGG GAGGCTGGCC 
GACCAGGCCC ACCCGCGCCA CGCCCTCACG CCGGGGCTGC TGCTGCTGGC CCTCACCTTC 
GCCGCAGCGA CACTGCCGGG GTTGGAGGGG CGGCTGTGGT TCCTCGCGCC GCTGCTGGGG 
CTGAGTTACG GAGCTTTCAG TGCCGGGTGG AACGGGCTGG TGGGCCGGGT GTTGCCCAGC 
GGCCACCGGG CCGCCGCGTG GGGCACCGTG ATGGCGGTCG AGTCGCTGGG CTACGCCGTC 
GGTCCGCTGC TGGGTGGCCT TGCCTGGGCA CAGGCGGGAC CGGCGGGCGT CTTCACGCTG 
GGGGCGGCGG TGTTCCTGCT GACAGAAGGT TATTACCTGC TGCCGGGGCG CTCGCTGACG 
CGCCTGGCAC CACAGGAGAA CAAGCCGTCC GACCAGCCCA CCGGCTAA

Protein sequence

MLWTRPLVML RLLALLLTSE LVRTGFFVSA LPVAGPGLGL GTAVIGLMVG AHYLADALAK 
GPMGLVTERW GLGRVLALGS ALGLTAVLGA RLAPSPAWGV LGCALWGVAY AALWPGVMNT 
SQVLARPGHI ARALTLSSLS VAPAILGGVL GVGPLMQAHP GAAWALLAGV QGAALLLALS 
LVRLHLPGTG VPSGSVWQGW ARVAVLLPAA FAQTLAPGLL VTLFYPLLSR LGLGLGDLIG 
PGLLALAAFG VCLWGAGRLA DQAHPRHALT PGLLLLALTF AAATLPGLEG RLWFLAPLLG 
LSYGAFSAGW NGLVGRVLPS GHRAAAWGTV MAVESLGYAV GPLLGGLAWA QAGPAGVFTL 
GAAVFLLTEG YYLLPGRSLT RLAPQENKPS DQPTG