Gene Hoch_3868 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3868
Symbol
ID	8546263
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	5322081
End bp	5323406
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	69%
IMG OID	646388539
Product	Peptidase M75, Imelysin
Protein accession	YP_003268260
Protein GI	262197051
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3487] Uncharacterized iron-regulated protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.670817
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.169885
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACATCC GCACCGACGT CGCCTGGTCG CGCCCGCGCG GCGCCCGCGC TCGCCGCCTT 
CTGGCCCTGC CCCTCACCTT CGCCCTGCTG CCGCTCGGCC TCGCCGCGTG CGGCGATGAC 
GGCGGCGACA CCACGCCCGA CATCGACGCT GGCGCCGACG TCGACGCCGC GCCGCCGGTG 
GCCCAGGTGA GCCGCGCCGA GGTCGTCGAG CACTACGCGA CCATCGTGCA CGCCAACTAC 
AAGGACGCGC TCGACCGCGC CCTGCACCTG CAGAGCACCA TCGACCTGTT CCTGGCCGAG 
CCCACGGCTT CGCGTTTCGA GACGGTCAAG CGCGCCTGGC TCGAGGCCCG CGTGCCCTAC 
GGTCAGTCCG AGGCCTATCG CTTCTACGAG GGCCCGATCG ACGACGCCGA CGGCCCCGAG 
GGTCAGCTCA ACGCCTGGCC CATGGACGAG GCCTACGTCG ACTACGTGAT CGATCCGCAG 
ACCGAAGAGA CGATCATCAC CGGCATCGTC AACGACCCCG AGCGCGAGAT CACCAAGGAA 
GCGCTGGCCT CGCTCAACGA GGGTGGCGAG GGCGACATCT TCGACGGCGG CGACAACTTC 
GACCCCGAGA AGGCGGTGTC CACCGGCTAC CACGCCATCG AGTTCCTGCT CTGGGGTCAG 
GACCTCAACG ACGAGGCCCC GGGCGAGCGT CCCTTCCAGG ACTACCTGGC CAGCGACGAT 
CCCGACGCCA CCGCGCCCAA CGGCGAGCGC CGCGGCGAGT ACCTCAAGGT CGTCACCGAG 
CTGCTGATCG ACGACCTCAG CGGCCTGGTC GACGCCTGGG CCCCGGACAC CGCCGACAAC 
TACCGCGCCT CGTTCACCGG CGGCGACCCC GACGACGCCC TGCGCGACGT GCTCTCGGGC 
ATCGGCGTGC TCAGCAAGGG CGAGCTGGGG GCCGAGCGCA TGGACGTGGC CCTGCGCAGC 
CTCGACCAGG AAGACGAGCA CTCGTGCTTC TCGGACAACA CCCACGTGGA CATCGCCATG 
AACGCCCAGG GCATCCAGAA CGTGTACCTG GGCCGCTACA GCTACCTCTC GGGCCCGAGC 
ATCTCCGACC TGGTGCGCCA GGAGGATCCC GCGCTCGACG CCGAGATGCG CGCCGCCTTC 
GAGAAGAGCC TGGCCGCGGT GCAGGCCATC CCCGTGCCCT TCGACCAGAA CATCGACGCC 
CAGGGCTCCG AGGGCTGGAA TCTGGTCAAC GAGGCGGTCA ACGCGCTCTT TGACCAGAGT 
GAGACGATCA TCGAGGTCGG CGAGGCGCTC GGCCTGGGCA ACGTCAGCGT CGACCTGCCC 
GAGTAA

Protein sequence

MNIRTDVAWS RPRGARARRL LALPLTFALL PLGLAACGDD GGDTTPDIDA GADVDAAPPV 
AQVSRAEVVE HYATIVHANY KDALDRALHL QSTIDLFLAE PTASRFETVK RAWLEARVPY 
GQSEAYRFYE GPIDDADGPE GQLNAWPMDE AYVDYVIDPQ TEETIITGIV NDPEREITKE 
ALASLNEGGE GDIFDGGDNF DPEKAVSTGY HAIEFLLWGQ DLNDEAPGER PFQDYLASDD 
PDATAPNGER RGEYLKVVTE LLIDDLSGLV DAWAPDTADN YRASFTGGDP DDALRDVLSG 
IGVLSKGELG AERMDVALRS LDQEDEHSCF SDNTHVDIAM NAQGIQNVYL GRYSYLSGPS 
ISDLVRQEDP ALDAEMRAAF EKSLAAVQAI PVPFDQNIDA QGSEGWNLVN EAVNALFDQS 
ETIIEVGEAL GLGNVSVDLP E