Gene Hoch_5176 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_5176
Symbol
ID	8547588
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	7126454
End bp	7128514
Gene Length	2061 bp
Protein Length	686 aa
Translation table	11
GC content	71%
IMG OID	646389853
Product	amidohydrolase
Protein accession	YP_003269557
Protein GI	262198348
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1228] Imidazolonepropionase and related amidohydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.167618
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.830849
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCAGCT TATCCCGCCC CCTCCTCACC TGCCTCGCTG TGCTCGCGCT CGCCGTGGGC 
TGCGCGCCCA GATCCGGCTC CGCCGAGAAC CCAGATCCAG AGCAGGACCA GCAGCAGAAC 
CCGCAGCGGC GCTACAGCGT GCTGCTGATG GGCACGCGCG TGGGCGAGCA GGTCGTGCGC 
CAGGACGCCA GCGGCCACAG CCTGGTGACA TTTTCGTACA ACGACCGCGG CCGCGGCCCC 
GACCTCAACG CCGAATTCTC GGTGTCGCCG GACGGGCTGC CGGAGCGCGT CGCCATCACC 
GGCCGCGACT ATCTCGGCCA GGCGGTCGAC GAATTCTTCG AACGCCGCGA CGGTCGCGCC 
GAGTGGCGCA GCAACGGCAA CTCGGACAGC CGGACGGTAT CCGCGCCGGG GTTTTACTGG 
GCCATGGCCG GCGTCCCCGC GCAAGGCGCC ATCCTGGCCC GCGCGCTGCT GCGCAGCCCC 
GAGCACAGCC TGCCCATGTT GCCCGGCGGC CGAGCCGCGA TCGAGCGACT CGGCGCCGAG 
ACCCTGCGCG CCCCCGATGG TTCGCCGCGG CAGGTGGTGC ACTACGCCAT CACCGGCCTC 
AGCTTCGGAC CCGAGCACAT CTGGCTCGAC GACGAGCAGC GCTTCTTCGC CTCGCTGTCG 
AGCTGGGTCG CCATCATCGA GGAGGGCTAC GAGGACGATG CAGAGCGCCT GGCCGATATT 
CAGGAGCAGG CCGATGCCGC GCTGCGACAG GAGCAGGCCG AGCGCCTGGC CGAGCGCCCC 
GCGGGCGCGC TGGTGATTCG CGGCGTCGCC GTATTCGACC CCGAGACCCG CACCCTGCTG 
CGCGATCGCG ACGTCATCGT CGAGGGCGAG CGCATCGCCG CGCTCGCGCC CGCCGGCAGC 
GCAAAGCTCC CCGCGCAGGC CACCGTGATC GACGGCGTGG GCAAGACCCT GCTGCCCGGG 
CTGTGGGACA TGCACGTGCA CCTCAACGAC ACCGACAGCC TGCTGCATCT GGCCCTGGGC 
GTGACCTCGG TGCGCGACCT GGGCAACGAC ATCGAGTATC TCAGCCGCTA CCAGCAGGCC 
TGGCAGAGCG GCCAGCGGCT GGGCCCGAGG TTGGCGGTCA AAGCCGGACT CATGGACGGC 
CCCGGCCCCT ACGCGGGCCC CACCAAGGTG CTGGTGGCCA GCCGCGAGCA GGCGCGCGCG 
GCCATCGATC GCTACGCCGA GCTCGGCTAC CCGCAGATCA AGATCTACAG CTCGCTGCGG 
CCCGAGCTGC TGCCCGATAT CATCGATTAC GCCCACGCCC GCGGGCTGCG CGTGAGCGGA 
CACATCCCGG CGTTCATGAG CGCGGCCCAG CTCGTCGCGC TCGGCCTCGA CGAGCTGCAG 
CACATCAACT TCGTGGTGCT CAACTTCCTC TTCGACGAGG TCAAGGACAC GCGCACGCCC 
GCTCGCTTCC AGGCCGTGGC CGAACACGCC CACAAGCTCG ATCTCGACAG CCCCGAGGTG 
CAGGCGTTTA TCGACCTGCT GGTCGAGAAC CAGGTCGTGG TCGATCCCAC GGTGTCGATC 
TTCGAGAGCA TGTTCAACGA CCGACCGGGC GAGATGTCCA CGGTGTTCGC GCCGGTGGCC 
GATCGCCTGC CCGTGCAGGT GCGGCGCAAT CTGCTCGACG GCGGCCTGCC CGCCGACGAA 
GCCACGCGCG CGCGCTACGG CGACTCCTTC GACACCCTGC TGGCGCTGGT GGCGCGGCTG 
CATCGCGCCG GCGTGAGCAT CGTCGCCGGC ACCGACTCGC TGGCCGGCTT CGCCCTGCAC 
CGCGAGCTCG AGAACTACGT GCGCGCCGGC ATCCCGGCGC CCGAGGTGCT GCGCATCGCC 
ACCCTCGAGG CCGCGCGCCT GGCCGGCGCC GCCGACCAGC TCGGCACCAT CGCGCCGGGC 
AAGCTCGCCG ACATGGTGCT GGTCGAGGGC GACCCCACCA GCGACATCCG CGCCATCCGC 
GCGGTCGAAC TCACGGTCCA GCGGGGGACG ATCTTCCGCT CCGCGCGACT GCTCCAGAGC 
ATGGGCATCG CGCCGCGCTG A

Protein sequence

MRSLSRPLLT CLAVLALAVG CAPRSGSAEN PDPEQDQQQN PQRRYSVLLM GTRVGEQVVR 
QDASGHSLVT FSYNDRGRGP DLNAEFSVSP DGLPERVAIT GRDYLGQAVD EFFERRDGRA 
EWRSNGNSDS RTVSAPGFYW AMAGVPAQGA ILARALLRSP EHSLPMLPGG RAAIERLGAE 
TLRAPDGSPR QVVHYAITGL SFGPEHIWLD DEQRFFASLS SWVAIIEEGY EDDAERLADI 
QEQADAALRQ EQAERLAERP AGALVIRGVA VFDPETRTLL RDRDVIVEGE RIAALAPAGS 
AKLPAQATVI DGVGKTLLPG LWDMHVHLND TDSLLHLALG VTSVRDLGND IEYLSRYQQA 
WQSGQRLGPR LAVKAGLMDG PGPYAGPTKV LVASREQARA AIDRYAELGY PQIKIYSSLR 
PELLPDIIDY AHARGLRVSG HIPAFMSAAQ LVALGLDELQ HINFVVLNFL FDEVKDTRTP 
ARFQAVAEHA HKLDLDSPEV QAFIDLLVEN QVVVDPTVSI FESMFNDRPG EMSTVFAPVA 
DRLPVQVRRN LLDGGLPADE ATRARYGDSF DTLLALVARL HRAGVSIVAG TDSLAGFALH 
RELENYVRAG IPAPEVLRIA TLEAARLAGA ADQLGTIAPG KLADMVLVEG DPTSDIRAIR 
AVELTVQRGT IFRSARLLQS MGIAPR