Gene Dgeo_2371 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dgeo_2371
Symbol
ID	4073599
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Deinococcus geothermalis DSM 11300
Kingdom	Bacteria
Replicon accession	NC_008010
Strand	+
Start bp	117780
End bp	119000
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	59%
IMG OID	641228581
Product	major facilitator transporter
Protein accession	YP_593880
Protein GI	94971840
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.363547
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCTTCTT TGGCGACCTA TGGCGTCGGT TACGTGGCCC GGCCGATTGG GGCCTTTATG 
CTGGGGCGTT ACGGCGATCG CCACGGGCGC AAGAGCGTGT TGGTGTTGTG CATGCTGTTG 
ATGGGCTTCT CGACCCTGGC GGTCGCCTTC TTGCCCACCT ACCAGCAGGT TGGGGTCGTG 
GCCCCGTTGC TGTTGGTGAT CTTGCGACTT ATCCAGGGCT TTGCGGTTGC TGGTGAAATC 
AGCGGCGCCA GCTCAATGAT CTCCGAACAC GCGCCTTTTG GTCGTCGGGG TTACTTTTCC 
AGTTTTGCAC TCCAAGGAAC ACAGATCGGA CAACTGCTCG CCGCCGCCGT GTTTTTGCCG 
CTGGCCCACT TTCTGCCTGA GGAGGACTTC AACTCCTGGG GTTGGCGTAT TCCGTTTCTC 
CTGAGTCTAT TGGTGCTGAT CGCGGGATAC TTCATTCGCC GCAACGTGGA TGAGACGCCC 
GCCTTTACTC GGGAAGAAGA GACGGGCAGT GTACCCGAGT CACCCATTCG CACGGCCTTC 
CGCTTGGGCG GGGCCGACAT CTTCCGGGTG ATGTGTATGG CCCTGATGAA CGTTATTCCC 
ACCATCACCA CTGTGTTTGG GGCTGCCTAC GCCACGCAAA AGGACTACGG GATCGGGTTT 
TCCAAAGAGG TCTACTTATG GATTCCGGTG GTGGGAAATA TCGTCGCCGC CCTGCTTATT 
CCCTGGGTTG GCTCGCTCAG TGACCGCATT GGCCGCCGCC CGCCGATCAT CTTCGGGGCC 
TTGGGCTCGG GATTGCTGTC CTTTGGATAT CTGTGGGCCA TAGGACAACA CAACGTCACG 
CTGGCCTTTG TCTTTTCGAT CCTGATGTGG GGCATCGTCT ATCAGGGATA TAACGCCACG 
TTCCCCTCCT TTTATCCCGA ACTGTTCCCT ACCAAAACCC GCGTAACCTC GATGGCGATC 
GGCCAGAACA TCGGCACCAT GCTGACCGCC TTCTTTCCCG TGCTGCTTTC GCAGTACATC 
GCGCCTCCGG GCAGCGCTGA TATTCCCATC AAGGTGGGTC TCTTTACCCT CATGGTAACC 
ATGATCTCAG CGGCGGCGGC CTACTCCGCC CGTGAAACTT ACCGGATCCC CCTGAGCGAA 
CTCGGCAACG CCAACGCCCA GCCTCTTCCC GCGGCTGAAT ACCTGCGACT GCGGGAAGGG 
ACAGGAGGTA GGGCCCCCTG A

Protein sequence

MASLATYGVG YVARPIGAFM LGRYGDRHGR KSVLVLCMLL MGFSTLAVAF LPTYQQVGVV 
APLLLVILRL IQGFAVAGEI SGASSMISEH APFGRRGYFS SFALQGTQIG QLLAAAVFLP 
LAHFLPEEDF NSWGWRIPFL LSLLVLIAGY FIRRNVDETP AFTREEETGS VPESPIRTAF 
RLGGADIFRV MCMALMNVIP TITTVFGAAY ATQKDYGIGF SKEVYLWIPV VGNIVAALLI 
PWVGSLSDRI GRRPPIIFGA LGSGLLSFGY LWAIGQHNVT LAFVFSILMW GIVYQGYNAT 
FPSFYPELFP TKTRVTSMAI GQNIGTMLTA FFPVLLSQYI APPGSADIPI KVGLFTLMVT 
MISAAAAYSA RETYRIPLSE LGNANAQPLP AAEYLRLREG TGGRAP