Gene Dgeo_0174 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dgeo_0174
Symbol
ID	4058420
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Deinococcus geothermalis DSM 11300
Kingdom	Bacteria
Replicon accession	NC_008025
Strand	-
Start bp	162924
End bp	163826
Gene Length	903 bp
Protein Length	300 aa
Translation table	11
GC content	63%
IMG OID	641229172
Product	substrate-binding region of ABC-type glycine betaine transport system
Protein accession	YP_603646
Protein GI	94984282
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1732] Periplasmic glycine betaine/choline-binding (lipo)protein of an ABC-type transport system (osmoprotectant binding protein)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.335046
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAAGG TCCTCTGTCT CTCACTGGCT GTGCTGATGG GCAGCGCCGC CGCCAAACCT 
ATTGTGGTGG GCAGCAAGCT CGACCCCGAG GCCCAGATTC TCGGGCAGAT GATCGTCTTG 
ACGCTGCGCA ATGCCGGGCT GGAGGTGAGC GACAAGACCA ATCTGGGTGA TACCGGCGTG 
AACCGCAAGG CGATTCTGGC GGGTGAGATC GACGTGTACC CCGAGTACAC CGGCAACGCG 
GTGTATCTCT TTCCACAGGC CAAGATCAGC GCCAAGGATG CAGGGAATCC CGGCAAAATC 
TACGGGTATG CCCGGCAGCT CGACGCCAAA AACGGCATCA CTTGGCTGAA GCCGGCCAAC 
GTCAACAACA CCTGGGTGAT CGCCGTGCCG CAAGCGCTGG CACAACGGGA AAAGCTGAGC 
AGCGTGGCCG ACCTGGCTCG CTACCTCCAG GCGGGGGGCC GCTTCAAGAT CGCCGGGAGT 
CCCGAGTTCT TTAACCGCCC GGACACCATG CCCGCCTTTG AGGCTGCCTA CGGCTTCAAG 
CTGCGACCCG ACCAGAAGCT GGTGTTGGCT GGGGCCACGC CGCCACAGAC GCAGCAGGCG 
GCCGCCAACG GCACCAACGG TGTGAATGCT GCGATGGCCT ACGGCACAGA CGGCACCCTG 
GCCGCGCTCA AATTGGTGGC CCTCAAAGAT CCCAAGGGCG CACAGGCGGT CTATCAGCCT 
GCCCCGATCA TCCGCAGCGA GGTGCTCCAG GCTCACCCGG AGATCGGGAC ACTGCTCAAC 
AAGACCTTTG CCACGCTCAC GCAAGCGGGG CTGCAAAGGT TAAATGCCCA GGTCGCGCTC 
GAAGGCCGCA CCGCGCAGGA GGTGGCCCAA AGCTACCTCA AGAGCAAGGG GCTGATCAAG 
TGA

Protein sequence

MSKVLCLSLA VLMGSAAAKP IVVGSKLDPE AQILGQMIVL TLRNAGLEVS DKTNLGDTGV 
NRKAILAGEI DVYPEYTGNA VYLFPQAKIS AKDAGNPGKI YGYARQLDAK NGITWLKPAN 
VNNTWVIAVP QALAQREKLS SVADLARYLQ AGGRFKIAGS PEFFNRPDTM PAFEAAYGFK 
LRPDQKLVLA GATPPQTQQA AANGTNGVNA AMAYGTDGTL AALKLVALKD PKGAQAVYQP 
APIIRSEVLQ AHPEIGTLLN KTFATLTQAG LQRLNAQVAL EGRTAQEVAQ SYLKSKGLIK