Gene Dgeo_2419 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dgeo_2419
Symbol
ID	4073647
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Deinococcus geothermalis DSM 11300
Kingdom	Bacteria
Replicon accession	NC_008010
Strand	-
Start bp	67111
End bp	68088
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	69%
IMG OID	641228534
Product	3,4-dihydroxyphenylacetate 2,3-dioxygenase HpaD
Protein accession	YP_593927
Protein GI	94971887
COG category	[R] General function prediction only
COG ID	[COG2514] Predicted ring-cleavage extradiol dioxygenase
TIGRFAM ID	[TIGR02295] 3,4-dihydroxyphenylacetate 2,3-dioxygenase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGGCCC CCGCCCATCC CGATATCGTT CGCGTCGCCC ACGCCGTCTT CACCGTCACG 
GACCTGGAAG CTTCGCGCGA GTTCTATGTG AACCTGCTCG GTCTGAACGT GCTGCACGAG 
GAGCCGGGCG CCCTCTACCT GCGCGGGGTG GAGGACCGCG AGTGGACCCT CAAGCTGGAA 
GAGAACCCGG AAGCCGGGGT GCGGCACATC GCCTACCGGG TGCGGACGTA CGCCGACCTG 
GACGGCCTGG TCGCGCTGGC GGAGCGTGAG GGCCTCCCCT CCCGCTGGGA AGAGGAACTC 
GACCGGCCCC GCATGCTGCG CATGCAAGAC CCCTTTGGCG TCCCGGTCGC CTTTTACCGC 
GAGAGCCGCA CCCACCCCTG GTTCTTGCAG GACTACCACC TGCACCGCGG GCCGGGTTTG 
CAACGGGTGG ACCACGTGAA CGTGATGACG CCGGACGTGG AAGGCATGCT GGGCTGGTAC 
ACGCGCGAAC TGGGGTTCCG CGTCTCCGAG TACACCGAGG ACGAGGCGGG GCGCATCTGG 
GCGGCCTGGA TTCAGCGGCG GGGCGGCGTG CATGACCTCG CCCTGACGAA TGGCGCGGGG 
CCGCGGCTGC ACCACTGGGC CTACTGGATG CCCGACGCCA TGAGCATCAT CCGCGCCTGC 
GACATCCTGG CGGGGGCGCG GCAGCCCGAG CGCATCGAGC GCGGGCCGGG GCGGCACGGC 
ATCTCCAACG CCTTTTTCCT GTATATCCGC GACCCAGACG GCCACCGCAT CGAGCTGTAC 
ACCTCTGACT ACCTCACGGT GGACCCCGAC TTCCAGCCCA TCCGCTGGCA GCTCAACGAC 
CCGCGGCGCC AGACGCTGTG GGGGGCCAAG ACGCCGCGGA GCTGGTTTGA GGAAGGCTCG 
CGGCTGGAAG CTTTCGGCGG GGGCTGGGTC ACGCCGGCGG AGGGGCAGCT GAAGGGGCTA 
CCGGTTCATG TCATCTGA

Protein sequence

MTAPAHPDIV RVAHAVFTVT DLEASREFYV NLLGLNVLHE EPGALYLRGV EDREWTLKLE 
ENPEAGVRHI AYRVRTYADL DGLVALAERE GLPSRWEEEL DRPRMLRMQD PFGVPVAFYR 
ESRTHPWFLQ DYHLHRGPGL QRVDHVNVMT PDVEGMLGWY TRELGFRVSE YTEDEAGRIW 
AAWIQRRGGV HDLALTNGAG PRLHHWAYWM PDAMSIIRAC DILAGARQPE RIERGPGRHG 
ISNAFFLYIR DPDGHRIELY TSDYLTVDPD FQPIRWQLND PRRQTLWGAK TPRSWFEEGS 
RLEAFGGGWV TPAEGQLKGL PVHVI