Gene Hoch_5224 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_5224
Symbol
ID	8547636
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	7179703
End bp	7181349
Gene Length	1647 bp
Protein Length	548 aa
Translation table	11
GC content	70%
IMG OID	646389898
Product	benzoyl-CoA-dihydrodiol lyase
Protein accession	YP_003269602
Protein GI	262198393
COG category	[I] Lipid transport and metabolism
COG ID	[COG1024] Enoyl-CoA hydratase/carnithine racemase
TIGRFAM ID	[TIGR03222] benzoyl-CoA-dihydrodiol lyase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCCGA TCCGCTTCGA AACCCATCCC AGCGAGTACA AGCATTGGCA ACTGGACGTC 
GACGGTCCGG TTGCCAAGCT CACCATGGCC GTCGACGCCG AGCATCCGCT GCGCCCCGGC 
TACGAGCTAA AGCTCAACTC CTACGACCTC TCGGTCGACA TCGAGCTGGC CGACGCCGTG 
CAGCGCATTC GCTTCGAGCA CCCCGAGGTG CGCACCGTGG TCATCTCGGC CGACCTCGAT 
CGCGTGTTCT GCTCAGGCGC GAACATCTAC ATGCTCGGCG CCTCGGACCA CAGCTTCAAG 
GTCAACTTCT GCAAGTACAC CAACGAGACC CGGCTGTACA TGGAGGAGGC CTCGCGCAAC 
AGCGGGCTGC GCTTCCTGGC CGCGTGCAAG GGCACCACGG CCGGCGGCGG CTACGAGCTG 
GCCCTGGCCT GCGACCACAT CACCCTGGTC GACGACGGCT CGTCCGCGGT GTCGTTTCCC 
GAGACCCCGC TGCTCGGCGT ATTGCCCGGC ACCGGCGGCC TCACCCGCCT GGTCGACAAA 
CGCAAAGTGC GCCGCGATCG CGCCGACGTA TTCTGCACCC TGGCCGAGGG CATCAAGGGC 
CGGCGCGCGG TCGAGTGGGG CCTGGTCGAC CAGCTCCTGC CGCGCTCCAA GTTCGACGAG 
GGCGTACGCG CGCGCGCCGA AGAGCTGGCC AAGGAGGTCG CCGAGGTCGC CCACGGCCCG 
GCCGTGAGCC TGCCGCCGCT GGCGCCGAGC ATCGAGGACG ATCTCATCAG CTACCGCCAT 
GTGAGCGTCG AGTTCGAGCG CTCGCAGCGC ACGGCCACGC TGACCCTGCG CGCGCCCGCC 
GAGGCGCCGC CTACCAGCAT CGAGGACAGC GCCGCCCAGG GCGCCGATCT GTGGAGCCTG 
CGCCTGTTCC GCGAGCTCGA CCACGCGCTC TGCCACCTGC GCTTCAACGA GCCCGAGATC 
GGCCTGGTGC TGGTCCGCAG CGTCGGCGAT CCCGCCCAGG TGCTGGCCGC CGACGCCGCG 
CTCGACGCCC TGCAGGAGCA CGGCTTCACC CGCGAAGTGC GGCTGTTTCA GGCGCGCGTG 
CTGCGCCGCC TCGACACCAC CGCGCGCTCG TTCTTCGCCG TCATCGACAG CGACTCGAAC 
TGCTTCGCCG GCTCGCTGCT CGAGGTCGCC TTGGCCGCCG ACCGCGTGTA CATGCTCGAG 
GACGACGACG AGGAGGTCGG CGTGCATACC TCGGTCGCCA ACAGCGGCAT CATGCCCATG 
GCCAACGGCC TCAGCCGCCT GGCCGTGCGC TTCTACGGCG ATGCCGACCA GGTGGACGAA 
GTCCTCGGCC GCGGCAAAGA CGGCCTCATC CCCACCGCGG ACGCCGAGGA GCTGGGACTG 
GCCACCATCG CCGCCGACGA CATCGACTTC GAGGACGAGC TGCGCATCGC GTGCGAGGAG 
CGCGCATCGC TGTCGCCCGA CGCGCTCACC GGCATGGAGG CCTCGCTGCG CTTCCCCGGC 
CCCGAGACCC TCGAGACCAA GATCTTCGGA CGCCTGTCCG CGTGGCAGAA CTGGATCTTC 
ACCCGCCCCA ACGCCACCGG CGAGCGCGGC GCCCTCACCC TCTACGGACA ACCCGAGCGC 
CCCAGCTTCC GCTGGGCGAG GACTTAA

Protein sequence

MAPIRFETHP SEYKHWQLDV DGPVAKLTMA VDAEHPLRPG YELKLNSYDL SVDIELADAV 
QRIRFEHPEV RTVVISADLD RVFCSGANIY MLGASDHSFK VNFCKYTNET RLYMEEASRN 
SGLRFLAACK GTTAGGGYEL ALACDHITLV DDGSSAVSFP ETPLLGVLPG TGGLTRLVDK 
RKVRRDRADV FCTLAEGIKG RRAVEWGLVD QLLPRSKFDE GVRARAEELA KEVAEVAHGP 
AVSLPPLAPS IEDDLISYRH VSVEFERSQR TATLTLRAPA EAPPTSIEDS AAQGADLWSL 
RLFRELDHAL CHLRFNEPEI GLVLVRSVGD PAQVLAADAA LDALQEHGFT REVRLFQARV 
LRRLDTTARS FFAVIDSDSN CFAGSLLEVA LAADRVYMLE DDDEEVGVHT SVANSGIMPM 
ANGLSRLAVR FYGDADQVDE VLGRGKDGLI PTADAEELGL ATIAADDIDF EDELRIACEE 
RASLSPDALT GMEASLRFPG PETLETKIFG RLSAWQNWIF TRPNATGERG ALTLYGQPER 
PSFRWART