Gene Dgeo_1500 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dgeo_1500
Symbol
ID	4057386
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Deinococcus geothermalis DSM 11300
Kingdom	Bacteria
Replicon accession	NC_008025
Strand	+
Start bp	1587019
End bp	1588200
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	62%
IMG OID	641230518
Product	extracellular solute-binding protein
Protein accession	YP_604964
Protein GI	94985600
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2182] Maltose-binding periplasmic proteins/domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAAAG CACTGACTGT TCTGTCTCTC GCCCTGCTGG GGAATGCCAG CGCCGCCACC 
ATCACTGTCT GGACACATTT TGGCGGGCCC GAGCAGGCGT GGCTCAAGGA TCAGGCGCAA 
GCCTTCGAAA AGAAGACTGG GAACCGAGTG CAGCTCGTCA ATGTGCCCTT CGAGCAGATT 
CCCGACAAGT TCATTCAGAG CGCGCCCAAG GGCCAGGGGC CGGACCTGCT GGTCACGCAG 
CCGCAGGACC GCATCGGGCA GTTTGCGGCA GCGGGCGTGA TCGAGCCGAT GGACAAGTAC 
CTGGTCAGCC GCAGCGACCT CGACAAGACG GCGCTGGGCG CCATGACTTA CAAGGGCAAG 
CTGTTCGGCC TGCCGATGTT CGCCGAGGCG GTGGGCGTGG TCTACAACAA GAAGCTGGTG 
CCTAACCCGC CTACCACCTG GGCTGAATTC CTGAAGGTGG CGCAGGCCAA CACCGGGAGC 
GGCAAGTTCG GCTACCTGGA AGACCTCAGC GAGGCCTACC AGAACTACGG CGTGATCAGT 
GCGTACGGCG GCTACGTCTT CAAGAACAAT GGCGGCACCC TCAATGTCAA GGACGTGGGC 
CTGAACAACG CTGGGGCAGT CAAGGCGAGC AGCTTCTTGA ACGACCTGCG TTACAAGTAC 
AACCTAGTGC CCGAAGGGGT TACCAGCGAC GTGGCCAAGA GTGCCTTCCT GGACGGGCGT 
CTCGCCATGT TCCTGACCGG GCCCTGGAAC ATGGGCGATA TCAAGAAGGC AGGCATCAGC 
TACGGCATCA TGCCTTTCCC CACGCCTCCC GGCGCGAGCG GCAAGTGGAG CCCCTTCGTG 
GGGGTGCAGG GCATCATGCT GAGCGCGTAC AGCAAGAACA AGGCCGCCGC GGCGCAGTTT 
GCCAAGCAGC TTGTGACCAG CGACGCGCAA GTCGGCTTCA ACAAGGCGGG CGGGCGCATC 
CCGGTCAGCC TGAGCGCGCG GACCAAGCTC AAGAATGATC CAGTGGTTGC GGGCTTCGGT 
AAGACCATCA GCATGGGCAC CCCGATGCCC AACGTGCCCG AGATGAGCGC AGTGTGGGGC 
CCCTGGACGA ACGCCATCGC CCAGAGCGTG CAGAAGCCGG GCGCCGACTA CAAGCAGATC 
CTCGACAAGG CCGTCGCGGA AATCAACAGC AACATCAAGT AA

Protein sequence

MKKALTVLSL ALLGNASAAT ITVWTHFGGP EQAWLKDQAQ AFEKKTGNRV QLVNVPFEQI 
PDKFIQSAPK GQGPDLLVTQ PQDRIGQFAA AGVIEPMDKY LVSRSDLDKT ALGAMTYKGK 
LFGLPMFAEA VGVVYNKKLV PNPPTTWAEF LKVAQANTGS GKFGYLEDLS EAYQNYGVIS 
AYGGYVFKNN GGTLNVKDVG LNNAGAVKAS SFLNDLRYKY NLVPEGVTSD VAKSAFLDGR 
LAMFLTGPWN MGDIKKAGIS YGIMPFPTPP GASGKWSPFV GVQGIMLSAY SKNKAAAAQF 
AKQLVTSDAQ VGFNKAGGRI PVSLSARTKL KNDPVVAGFG KTISMGTPMP NVPEMSAVWG 
PWTNAIAQSV QKPGADYKQI LDKAVAEINS NIK