Gene Dgeo_2693 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dgeo_2693
Symbol
ID	4073924
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Deinococcus geothermalis DSM 11300
Kingdom	Bacteria
Replicon accession	NC_008010
Strand	+
Start bp	335377
End bp	336846
Gene Length	1470 bp
Protein Length	489 aa
Translation table	11
GC content	63%
IMG OID	641228783
Product	glycoside hydrolase family protein
Protein accession	YP_594200
Protein GI	94972160
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2730] Endoglucanase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTACAGG TCAAGAACGG TCAGATCGTG AACGATCGGA ACGAGCGGGT GCGGCTTCGC 
GGAACGTGCG TCGGCGGGTG GATGCACATG GAAAACTTCA TCAACGGCTA CCCCGGCGCT 
GAGCACGCCC TGCGGGAGAC GATGCAGGAC ATCCTCGGAT CCGCGAGGAC AGAGTTCTTC 
TTTGAGCGGC TCCTCGATCA CTTCTTCACT GAGGAGGACG TGGTGTTCAT CCGCTCCACG 
GGCGCGAATA CCGTACGCAT CGCCCTCAAC TACCGCCAGT TCGAACGAGA TGACCGTCCG 
TTCGAGTACC TGGAGTCTGG TTTCCAGCGG CTGGAGCAGG CGCTGGCCTG GTGCGCAAAG 
CACGAGGTCT ACGCCATCCT CGACCTCCAC GCCGTACAGG GATGGCAAAA CACCGACTGG 
CACAGCGACA ACGCAAACCG CAACACCCTC TTTTGGCAGC ACCCTCACTT TCAGGACCGC 
TTTGTACGGC TGTGGGAGGT GCTCGCCGAG CGGCTGAGGG GCCAACCTTG GATCGCCGGG 
TACAACGTGA TGAACGAGCC GGTCACGAAC GCGCCACGGG GCCGTTTCGG GAGTAACGCG 
TACACGCCGG ACTGGGAGGT CATCAACCAG GTGTACCGCC GTGTCGTGGG CGCTATTCGC 
GCGCTTGACC CGGATCACAT CATCTTTCTA GAGGGCGACC TGTTCTCCAC CCGCTTCGAC 
GGGCTGGACG CACCCTTCGC GGAGAATCTG GTGTACTCCA GCCACAACTA CACCCCCGCC 
GGGTTCGGTC CGGGCGTGTA TCCGGGTGAA TTCCAGGGGT ACCTGGGCTC CTTCCAGAGC 
CAGCTCACCT TGCAGCACTG GGACCGGGAG AAGCAGCGCG AGGTGTTCCT GAGTACGGAA 
GGGGCGCGCT TTGCCCAACG GCACAACGTC CCCCTCTGGG TGGGCGAGTT CGGCTCGGTG 
TACAACGGCC CTGGTGACGA CATCCCTAGC CGTCTGCGCG CGATGGATGA TCAGATCGGC 
GTCTTCGAGG AGTTCGGCGC CCACTGGACG ACGTGGAACT ATAAGGACGT GGGTGTGATG 
GGACTGGTCA CGCTGGACCC GGACTCCCCC TACATGCGAC TTGTCGCGCC CAGCCTGCGG 
GCCAAGTACG AACTCGACAC CGACTTCTGG ATGGGTTGGC TACCGAGCAC GCCCGCCAAA 
GACAAGCTGA CGGAACTCGC CCGCATTATC GAGGCGACCG TGAACGACCC GAACATCGAG 
CCGGCCGCCA ACCGTCGTTT CCTCGGGCAG GCAACCTTCG ACCATTACGT CGGCGGGCTG 
CTGCAACCCT CGTACGTGCG ACTGTTTCAG GGCCTGAGCG AGCATGACCT CGACGAAGTG 
CTCTCTTCCT TCGCGTTCAG AAACTGCCGG CCAAACGCCG GACTCGTTCG CATCGTGGGC 
CGCCACACCC AGCAGCCGCA CACTGCTTAA

Protein sequence

MLQVKNGQIV NDRNERVRLR GTCVGGWMHM ENFINGYPGA EHALRETMQD ILGSARTEFF 
FERLLDHFFT EEDVVFIRST GANTVRIALN YRQFERDDRP FEYLESGFQR LEQALAWCAK 
HEVYAILDLH AVQGWQNTDW HSDNANRNTL FWQHPHFQDR FVRLWEVLAE RLRGQPWIAG 
YNVMNEPVTN APRGRFGSNA YTPDWEVINQ VYRRVVGAIR ALDPDHIIFL EGDLFSTRFD 
GLDAPFAENL VYSSHNYTPA GFGPGVYPGE FQGYLGSFQS QLTLQHWDRE KQREVFLSTE 
GARFAQRHNV PLWVGEFGSV YNGPGDDIPS RLRAMDDQIG VFEEFGAHWT TWNYKDVGVM 
GLVTLDPDSP YMRLVAPSLR AKYELDTDFW MGWLPSTPAK DKLTELARII EATVNDPNIE 
PAANRRFLGQ ATFDHYVGGL LQPSYVRLFQ GLSEHDLDEV LSSFAFRNCR PNAGLVRIVG 
RHTQQPHTA