Gene Dgeo_3106 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dgeo_3106
Symbol
ID	5687581
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Deinococcus geothermalis DSM 11300
Kingdom	Bacteria
Replicon accession	NC_009939
Strand	-
Start bp	196050
End bp	197276
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	61%
IMG OID	641262569
Product	ABC transporter, substrate binding periplasmic component
Protein accession	YP_001527843
Protein GI	158421616
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTCACC GTACCCTGTC CGTCGCCCTG ACCTTGTTCC TGGTCCTTGG CAGCAGTGCT 
GAGGCCGCTG ACCTGCGCTT CAGCACTTGG GCCGGCGGCG AGGGTCTGGC CCTCTTGCAG 
CAACTTGCCA AGGAGTACAC TGCCAAGACG GGTACGAACG TCAAAGTCGA GGTCACGCCC 
TTCGCGGACT ACAGCCGCAA GCTCTCCGTG CAGATTGCCT CGGGTGACGC CCCGGACATC 
GGCTGGGTGG CTGAGCGGGA CGTGCCGACC TTCCTCGCCT CGAACAATCT CGCCAACCTC 
AGCGCTTTAA GCAAGGACGC CTCGTTCAAT CTGAACGACT TCCCAACCTC CTCGTTGGCC 
CTCTGGAAGC AGGGCGGCAA TCTATATGGC ATTCCCTTTT CAAATTCACC GCTGGTGCTC 
TTTTACAACA AGGATCTCTT TAAGCAAGCT GGGGTTGCAG ACCCAATGAC CCAGTACGCC 
AAGGGGCAGT GGAGCTACAA CGACTTCCAA AAGAGTGCGC TCGCCATCAA ACAGAAAACC 
GGCAGCTACG GTGCACGCGT GATGCGCCTC GACCCCAAGG CGTGGGCGGG TGGCTTGCTG 
GCCGTTCTGT GGTCCCAGGG GGGCGGGGTA TACGACAAAA ATATGAAGTG TAACCTCAAC 
GCTCCCGGGA GCCTGCAAGC CTTCAGCCTC ATGCAGAACA TGATGTTCAA AGACCAGTCG 
ATGCCGCGCC CCGGCGACCA GACCAGCTTC GACGGCGGAA GGCTAGGCAT GTACTTCGAC 
AACATCAGCT ACGCCGGGCA ACTTAAGGAC GCCAAGTTCA AGTGGGGCAT CGCGCCGCTA 
CCGAAGGGGA GCGCGGGCCG GATCACCCAG CTCGGGCAGG CTGGATACGC TGTCTTCAGT 
AAGGGGCGGA ATCAGGCGGA GGCCGTCAAT TTTCTGAAGT TCATCGCCTC TAAGGAGAAT 
ATGGCCCGCA CCGCCAAGTT CTTCCCGCCG CCCCGCCAGT CAGTTCTCAG GAGCAGCGCC 
TACTTGAACG CCAACCCTGC AATTCCTGCC AGCGCCCTCA AGACCGCCCT TATCAGCCAG 
CTCGGCAGCG CCCGTGTGCT GCAAACCGAC ACCCACTGGC TCAAGGCGAA CGACGCGATC 
ACGGGCAGCC TCGACCAGGT ATTCCAGCCT GGCACCAACA CGAAAGCCAT CCTGGACCGT 
ACCTGCCAGA CGGTGGACGG CCTGTAG

Protein sequence

MRHRTLSVAL TLFLVLGSSA EAADLRFSTW AGGEGLALLQ QLAKEYTAKT GTNVKVEVTP 
FADYSRKLSV QIASGDAPDI GWVAERDVPT FLASNNLANL SALSKDASFN LNDFPTSSLA 
LWKQGGNLYG IPFSNSPLVL FYNKDLFKQA GVADPMTQYA KGQWSYNDFQ KSALAIKQKT 
GSYGARVMRL DPKAWAGGLL AVLWSQGGGV YDKNMKCNLN APGSLQAFSL MQNMMFKDQS 
MPRPGDQTSF DGGRLGMYFD NISYAGQLKD AKFKWGIAPL PKGSAGRITQ LGQAGYAVFS 
KGRNQAEAVN FLKFIASKEN MARTAKFFPP PRQSVLRSSA YLNANPAIPA SALKTALISQ 
LGSARVLQTD THWLKANDAI TGSLDQVFQP GTNTKAILDR TCQTVDGL