Gene Dgeo_2641 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dgeo_2641
Symbol
ID	4073872
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Deinococcus geothermalis DSM 11300
Kingdom	Bacteria
Replicon accession	NC_008010
Strand	+
Start bp	401172
End bp	402671
Gene Length	1500 bp
Protein Length	499 aa
Translation table	11
GC content	66%
IMG OID	641228835
Product	major facilitator transporter
Protein accession	YP_594148
Protein GI	94972108
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.893021
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCGCTT CCAGTGCCGC CCTGTCGCAT GTTGACTCGT TCGCCGCGTC CCTCAAAGCA 
CAGCTCGCTT CCCATCGCGC GGACAGCCTC CGTCGGCCCA CCGAGATTCT CTTCGCGATT 
CTGCAGGTGT GCGCACGGTT GCTTGTCACC TTGGCCGTAA CCCCGCAAAC CACCGCGCAG 
CTGGGGTCTA CACTCCAAAG GTGTTCGCTG TGTCTCGGCC TTCCGGAGGT CAAACCCGTG 
TCTGATGCGG CTCTGTCCTC TTCTACCTCG AGCCGTGCGG TGCTGCGCCT CCCCGAATTC 
CGGGCTATGC TGCTGGCGAC CGTCTGCAGC ACCCTGGCCG GACGCGCCGT GGCGCTCACC 
GTGGCCTATC AGCTCTATCA GCTCACCAAG AATCCGCTCA CCCTGGGCAT CTTGGGCCTG 
GTGGAGGCCA TCCCAGCGCT GAGTCTTGCG CTGCTCGGGG GCGTGGTAGC CGACCGCAAC 
GACCGTCGCC GTATTCTGCT GCTGACCACC AGCGTAGAAG TGATCTGCGC GCTGCTGTTT 
TTCCTGTATG CGCCGCATGC CTCAACCCTG GGCTACGCCC CGATTCTGGC CCTGATCTTC 
CTGCTGGGGA TTGCCCGCGG CTTTTCCGAC CCAGCACTTC CCGCCTTTGA GGCCCAGGTT 
GTGCCACGCG AGCTCTTGCT GCGTGCCTCA GCCTGGCAGT CGAGCGCGTG GCAGGCGGCG 
GCCATCCTGG GGCCGGCTCT GGGAGGTGTG CTGTATGCAG CCGTCAGCGC GCGCGGCACT 
TACCTCGTTG CAGCCGTCCT GTATGGCTTG GCCCTGGCTT GCCTCGCCTA TGTCAGGCCC 
AAGCCGCGTC CGGCATTCAC CCCTGGCGAG CCGGTGTGGC AGAGCGTGAA GGAGGGCTTG 
GCCTTTGTGA TGCAGCGGCA GGTGCTGGTG GGCAGTATGG CCCTGGACCT GTTCAGCGTG 
CTGTTCGGCG GCGCGGTGGC CTTGCTTCCA GTCTTTGCCT CCGACATCCT GCGGGTGGGA 
CCGCAGGGTC TAGGGGTGCT GGTCGCCGCA CCCAGCATTG GGGCCCTGGC CGTGATGCTG 
GCAGCAACTC ACCGCCCCCC AGGACGCGGC GCAGGACGCA CGCTGCTGCT TGCCGTGGCG 
GGCTTTGGGA TATGTATGGT GGTGTTCGGG CTGTCACGCA ACTTCTTCCT CAGTGTGGCG 
GTACTGGTTG CAGCAGGTGT GTTCGACGGC ATCAGCATGG TGGTGCGCCG AGCAACACTG 
CGGCTCAAGG CCCCCGACCA CATGCGCGGG CGGGTCAGCG CGGTCAGCAG CATGTTTATC 
GGAGCGAGCA ACGAGCTGGG CGCCTTTGAG AGTGGCCTGG CCGCGAGCTG GCTGGGCACC 
GCGCGCAGCG TGTGGCTGGG CGGGCTGGTC ACCCTGCTGG TGGTGGGTGT GACGGCCTAC 
CTCGCGCCAG AACTGCGGGC GATGGATCTC ACCGACATCG CCAAGGACCG GTCAGGCTGA

Protein sequence

MSASSAALSH VDSFAASLKA QLASHRADSL RRPTEILFAI LQVCARLLVT LAVTPQTTAQ 
LGSTLQRCSL CLGLPEVKPV SDAALSSSTS SRAVLRLPEF RAMLLATVCS TLAGRAVALT 
VAYQLYQLTK NPLTLGILGL VEAIPALSLA LLGGVVADRN DRRRILLLTT SVEVICALLF 
FLYAPHASTL GYAPILALIF LLGIARGFSD PALPAFEAQV VPRELLLRAS AWQSSAWQAA 
AILGPALGGV LYAAVSARGT YLVAAVLYGL ALACLAYVRP KPRPAFTPGE PVWQSVKEGL 
AFVMQRQVLV GSMALDLFSV LFGGAVALLP VFASDILRVG PQGLGVLVAA PSIGALAVML 
AATHRPPGRG AGRTLLLAVA GFGICMVVFG LSRNFFLSVA VLVAAGVFDG ISMVVRRATL 
RLKAPDHMRG RVSAVSSMFI GASNELGAFE SGLAASWLGT ARSVWLGGLV TLLVVGVTAY 
LAPELRAMDL TDIAKDRSG