Gene Hoch_2334 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_2334
Symbol
ID	8544720
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	3243808
End bp	3245175
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	69%
IMG OID	646387038
Product	amidohydrolase
Protein accession	YP_003266769
Protein GI	262195560
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1228] Imidazolonepropionase and related amidohydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.202717
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACACT GGCTTTGGTT TCTCCGCATC GCGTCGGTCT GCGCCCTGGT GTGCGCTTGC 
GGGGCTCCGC GCGGGCTTCA CGCCAGCCCG CCGGAGAGCG CCGCCAGCGG CGCCTTGTTG 
CCCGGTAGCT CGTTCTTGAT TCACGCCGGC GCGCTCATCG ACGGACGCTC GGACGAGCGC 
CGCACCCAGG TCAGCATCAC CGTGCAAGAC GGCAAAATCG CGGCCGTCTC GCCCGGCTTC 
GCGCGCCCGG CTCGCGGCCA GCGCGTCATC GACCTGCGCG CCTTCACCGT GCTGCCCGGG 
CTGATGGATA TGCACACGCA CCTCTCCGGT GAGCACAGCG ACAAGAGCTA CTCCGAGCGC 
TTCTTCATGG ATCCCAGCGA TGTCGCGCTG CGCTCCACGG TGTTCGCCCG CCGCACCCTG 
ATGGCCGGGT TCACCACCGT GCGCAACCTC GGCGACAGCC ACAACGTCAC CCGGGCGCTG 
CGCGACGCCG TGGCCAAGGG CTGGGTCGTG GGTCCGCGCA TCTTCACCGC CACCAAGTCG 
ATCGCCACCA CCGGCGGCCA CGCCGACCCG ACCAACGGCC TCAACGTCGA GCTGCGCGGT 
GAGCCCGGGC CCAAGCAGGG CGTCATCAAC AGCCCCGAAG AAGCCCGCGC AGCCGTGCGC 
CAGCGCTACA AGGAAGGCGC CGATCTCATC AAGATCACGG CCACAGGCGG CGTGCTCAGC 
CTCGCGGCCA GCGGCCAGAA CCCGCAGTTC ACCAGCCTCG AACTCGAGGC CCTGGTGACC 
GCGGCCAAGG ACTACGGCTT CACCGTGGCC GTGCACGCGC ACGGCGCCGA GGGCATGCGC 
CGCGCTGTAC TCGCGGGCGT GAGCTCGATC GAGCACGGCA CCTACATGGA CGACGAGATC 
ATGGCGCTGA TGAAAGCGCG CGGCACCTAC TACGTCCCGA CCATCTCGGC CGGCCGTTGG 
GTCGCGGACA AAGCCAAGGA GGACGGCTAT TTCCCCGCTA TCGTGCGCCC CAAAGCCGCC 
GCCATCGGCC CGCAGATCCA GGACACCTTC GCGCGCGCCT ACCGCGCCGG CGTCAACATC 
GCCTTCGGCA CCGACACCGG GGTCTCGGCC CACGGCGACA ACGCCCGGGA ATTCGTCTAC 
ATGGTCGAAG CCGGCATGCC GCCCATGGCC GCGATCCAGT CGGCGACCCG CGAGGCAGCC 
AAGCTGCTGC GCATCGACGA TCGCCTGGGC ACGGTCGAAG TCGGCAAGAT CGCCGACCTC 
GTCGCGGTGC GCGACAATCC CCTCGAGCGC ATCGAGACCA TGCTCGATGT GGCTTTTGTG 
ATGAAGGACG GCCAGGTCTT CAAGCTGCCG GCGACCGCCG AGCCGTGA

Protein sequence

MKHWLWFLRI ASVCALVCAC GAPRGLHASP PESAASGALL PGSSFLIHAG ALIDGRSDER 
RTQVSITVQD GKIAAVSPGF ARPARGQRVI DLRAFTVLPG LMDMHTHLSG EHSDKSYSER 
FFMDPSDVAL RSTVFARRTL MAGFTTVRNL GDSHNVTRAL RDAVAKGWVV GPRIFTATKS 
IATTGGHADP TNGLNVELRG EPGPKQGVIN SPEEARAAVR QRYKEGADLI KITATGGVLS 
LAASGQNPQF TSLELEALVT AAKDYGFTVA VHAHGAEGMR RAVLAGVSSI EHGTYMDDEI 
MALMKARGTY YVPTISAGRW VADKAKEDGY FPAIVRPKAA AIGPQIQDTF ARAYRAGVNI 
AFGTDTGVSA HGDNAREFVY MVEAGMPPMA AIQSATREAA KLLRIDDRLG TVEVGKIADL 
VAVRDNPLER IETMLDVAFV MKDGQVFKLP ATAEP