Gene Hoch_3804 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3804
Symbol
ID	8546197
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	5222973
End bp	5224136
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	72%
IMG OID	646388474
Product	metallophosphoesterase
Protein accession	YP_003268197
Protein GI	262196988
COG category	[R] General function prediction only
COG ID	[COG1409] Predicted phosphohydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0698095
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.131699
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACAC CGCACGCCCG CCTCGTCCTC GTCCTCGCGT CGCTGTCGCT GTCGCTGGCG 
GCCGCGCCTG GTTGTCTGCG CGAGGGTCGC GAGCGCGCGC GCGCCGATCT CGAGGTCGGC 
CAGGTCGCGC TCGCCGAGGT CGCGCTCGCG GTCGACGATG GCCTGGCCCA CGTCCGCGCG 
CTCACGCCGG GCAGCGACGC CGAGCCGGGC GCGATCGATC TCTGGGGGTC GGCCCCGGAT 
TTCCGCCTGA GCCTGCGCGC GCCCGCGGGC TCCTCGTGGT TACTCACGCT TGAGAACGCC 
ATGCCCGACG CCGAGCTGAG CGCGCTCGGC GAGGCCGACG GGCTGGCCAT CGACGCGCTC 
GAGGGCCCGC GGCCCACGGT GCGGCGCTGG TCGCTGCGCC TGGCCGAGGA CCCGGGCCAG 
CCCGGCGCCG AGCGCGCGCT GCGGCTGCGC GTGGCCCCGC CCGACGCCGA CGCCCGCGCC 
AGCGCCGGCC AGCCCTGGCG CTTTGCCGTC ATGGGCGACA TCCAGCGCGC GCTGCCCGAG 
GTCGACGACA TCTTCGCGCT CATCAACGAA GACCCCAGCG TCCGCTTCGT CGCCTCCACC 
GGCGACCTGG TCGATGGCGG CGAACACGAG GAGTACGAGC TGCTCGAGGA GCAGCTCGCG 
CTCCTCGAGG TGCCGTACTT CTCGACCATC GGCAACCACG AGCTGTTCGG CCCGGCCGAG 
CGCTGGAGCA GCCGCTTCGG CCGCTTCAAC CTGCACTTCC GCTTCAAGGG CGCCGCCTTC 
TCGCTCATCG ACTCCGGCAA CTCGAGCATC GATCCCATGG TCTACGACTG GCTGGGCGAG 
TGGGCCGAGG ACGCGCGCGA CGACGTGCAC TTCTTCTTCA CGCACTTTCC CGCGGTCGAT 
CCCGTGGGCG TGCGCGCTGG CTCGCTGCGC TCCTCGAGCG AGGCCCGCAA GCTGCTCGCC 
GTCCTCGCCG AGGGCGCCTT CGACGTCACC TTCTACGGCC ACATCCACTC CTACTACGCC 
TTTGAAAACG CCGGGATTCC GGCCTTTATC TCCGGCGGCG GCGGCGCCAT CCCCGAGCGC 
TGGGACGGCA TCGGTCGGCA CTTCCTCACC GTCGATGTCG GCCCCGAGGC CGTACGCGCG 
GTCTCGCTCG TGCGCGTGGA ATGA

Protein sequence

MSTPHARLVL VLASLSLSLA AAPGCLREGR ERARADLEVG QVALAEVALA VDDGLAHVRA 
LTPGSDAEPG AIDLWGSAPD FRLSLRAPAG SSWLLTLENA MPDAELSALG EADGLAIDAL 
EGPRPTVRRW SLRLAEDPGQ PGAERALRLR VAPPDADARA SAGQPWRFAV MGDIQRALPE 
VDDIFALINE DPSVRFVAST GDLVDGGEHE EYELLEEQLA LLEVPYFSTI GNHELFGPAE 
RWSSRFGRFN LHFRFKGAAF SLIDSGNSSI DPMVYDWLGE WAEDARDDVH FFFTHFPAVD 
PVGVRAGSLR SSSEARKLLA VLAEGAFDVT FYGHIHSYYA FENAGIPAFI SGGGGAIPER 
WDGIGRHFLT VDVGPEAVRA VSLVRVE