Gene Dgeo_2821 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dgeo_2821
Symbol
ID	4074050
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Deinococcus geothermalis DSM 11300
Kingdom	Bacteria
Replicon accession	NC_008010
Strand	+
Start bp	206750
End bp	208036
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	59%
IMG OID	641228659
Product	extracellular solute-binding protein
Protein accession	YP_594324
Protein GI	94972284
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.858803
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTCGCC TGACTCTGCT GTTTGCCCTG CCCGGTCTAC TGGTCGCTGT GCCTGCCCAT 
GCCCAGAGTG TCGACTGGAG CGCCTGTAAG GGCACAACCC TGCGTGTGCT GCTCAACCAG 
CATCCCTGGA CAACCGCGAT GCAGCCCGCC TTTCCAGAAT TTGAAAAGCT GACCGGGATG 
AAGCTGGCGG TAGAAACCTA TCCTGAGGCG CAGTTCCGGC AAAAAGTCTT GGTGGAACTC 
TCCACCGGGG GGCAGAATCT CGACGCCTTT ATGCTCTCGC CGGGCCAGGA AGGGCTGCTG 
TATGCCCGTA GCGGCTGGAT CGAGGACATG AAAACGTATA TCAACAATAA GAATTTGACT 
GCCGGAAACT GGGGCTTTTC TGACTTCTAT CCCTCGGTTG TGCGGTCCAC CGAGTACAAC 
GGAATCATGA CGGGTGTGCC GATCCAAACG GAAACACCGA TGCTGTTCTA TCGCAAGGAT 
CTATTTACCA AGTACAAGAT TCCAGTGCCC AAGACTATGG CCCAGCTCGA GGCTGCGGCC 
AAAGCCCTTC ATGGCAAAGA CGGCGTCTTT GGAATTGCTC TCCGTGGCAA GGGTGCGGCG 
GCCACCAGCC AGTTCAGCCC CTACATGTTC TCCTATGGCA GCACTTGGCT GAACAAAGAT 
GGCCAAGCCA ACTTTACCGA TCCCAAGTTT GTGCAGGCCA TGACGATGTA CACCGGCTTG 
CTGCGCAAGT ACGGCCCGCC AGCTGCCGTG ACGATGAGTT GGCCAGAGGT CACCAACCTC 
TTCGCGCAGG GCAAGGTCGC CATGTTCACC GACGCCTCGC TGTTTCGCAG CATTGTGGAC 
GATCCCAAAA GCAGCACGGT GGCCGGGAAG GTCGGTTATG CGCCATTCCC CGCTGGACCG 
GCCGGACGCA AGCCCTATGT GACCACTTGG GCCCTGAGTA TCCCCAAGGG CAGCAAGAAC 
AAGCCGTGCG CTTGGCTGTT TACCCAGTGG GCCACCAACC GCCAAAACCA GTTGCGCGTG 
CTGCTTCAGG ATGTGCCCGC TGTACGGCGC AGCGTCTGGA ACGACCCAGC TTTCAAAAAG 
CAGGAAACCA ACCCCGAGTG GACCCAGGCT CACCTCAGTC AGTTGGCCAG TGCCAACCCG 
CTGTGGAATC CCCCGGTCAG CCAGGTTGGC GAGGTGCGCG ATGCGCTGGG TCAGGCCATC 
GTGGGGATCT TGCAGGGCGG TAACACCCTA GACCTGCTCA AGCGTGCCGA GCAGACCACC 
AACGCGATCA TCAGCAAGGA AAAGTAA

Protein sequence

MRRLTLLFAL PGLLVAVPAH AQSVDWSACK GTTLRVLLNQ HPWTTAMQPA FPEFEKLTGM 
KLAVETYPEA QFRQKVLVEL STGGQNLDAF MLSPGQEGLL YARSGWIEDM KTYINNKNLT 
AGNWGFSDFY PSVVRSTEYN GIMTGVPIQT ETPMLFYRKD LFTKYKIPVP KTMAQLEAAA 
KALHGKDGVF GIALRGKGAA ATSQFSPYMF SYGSTWLNKD GQANFTDPKF VQAMTMYTGL 
LRKYGPPAAV TMSWPEVTNL FAQGKVAMFT DASLFRSIVD DPKSSTVAGK VGYAPFPAGP 
AGRKPYVTTW ALSIPKGSKN KPCAWLFTQW ATNRQNQLRV LLQDVPAVRR SVWNDPAFKK 
QETNPEWTQA HLSQLASANP LWNPPVSQVG EVRDALGQAI VGILQGGNTL DLLKRAEQTT 
NAIISKEK