Gene Hoch_5459 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_5459
Symbol
ID	8547872
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	7492446
End bp	7493990
Gene Length	1545 bp
Protein Length	514 aa
Translation table	11
GC content	68%
IMG OID	646390132
Product	Carotenoid oxygenase
Protein accession	YP_003269835
Protein GI	262198626
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3670] Lignostilbene-alpha,beta-dioxygenase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.176097
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.349671
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGAGC TGTACTCCAC TTCACACGCC GCGGCCGCCA ACGCTCACGC CGCAGCCGAC 
ACCTCGCCGT CGGCCGCGCC TGCGCATACA GCCGACGGCG AGGGGGTACA GGCGCCGCCC 
TGGGCCAACG CCTTCCGCGA GCTCACACGC GAGCACGATT TTCAGCCGCT TCGGGTCGAG 
GGCGTACTAC CGCCTGATCT CGAGGGCAGC TTCTACCAGA ACGGCCCGGT GCTGTTCTCG 
TCCCACGGAT ACCGCTACAC CCACTGGTTC GACGGCGACG GCGGCGTCTC GGCGGTTCGC 
CTGCAGGCCG GCCGCGCCCA CGGCGCCGCT CGGGTCACGG CCACGGCCGG CCTGATCGCC 
GAAGCGCGCG CGGGAAAACG CCTCTACGGC GGCTACAGCT CACCGCAGCC GGGCGCGGTG 
AAACGCCTCC TCGGCATTCT CAAGAACACC GCCAACACCT CCATGCTGGT GTGGAATCGG 
CGCCTGTTCG CGCTCATGGA GGCGGGACTG CCCACCGAGA TCGCGCCCGA GGACCTGCGC 
ACCCTGGGCG AGCGCGACCT CGGCGCGATC ACGCACGTGT TCTCAGCCCA CCCGCACTGG 
TGCGCGCGCC GCAACACCTA CTACGGCTTT GGCGTGCGCC CGGGCCGCCA GCAGCAGCTC 
GACATCTTCG AGCTAACCCA CACCGGCGTG GCGCGCCCCC TGTGTTCGGT CCCGCTGTCC 
GAACACACGC TGATCCACGA CTTCGCGATC ACGGGCCGCT ACCTGGTGTT CTTCGCCCCG 
CCCTTCGAAC TGCGCGCCTG GCGCATGCTC GCCGGCGAGG GCGGCTACGC CGACAATTTG 
CAGTGGAAGC CCGAGTACGG CACCGAGATC ATCGTGGTGC CCATCGACCT GCCGCACGCG 
GTGCAGCGCT TTCGCGTCGA TCCCTTCTTT CACTGGCACG TGGCCAACGG CTTCGACGAC 
GGCGACGACA TCGTGGTCGA CTTCGTCCGC TACGACGACT TTGAAAACAA CGCGTTCCTC 
GCCGACTTGC CCGCGGGCAA CGACACCCGC AACCTGGGCA GCAGGCTGGT CCGCGCCCGC 
ATCTCGCTCG CCAACACGCG CATGCGCCGC GAGGAGCGCT GGAGCCGCTC GGTCGAGTTT 
CCCCAGATCC GCCAGGATTA TTTCGGACGA CCGTACCGCT ACTGTTACCT GGCCGCCTAC 
GAGGACGGCG CCCCCGACAG CGGCCTGCAA AACGTGCTCG CCAAAGTCGA CATGCACAGC 
GGCGAGGTCC GCGAGTACAC CTGCGCGCCC GGCCGCTACC TGACAGAGGC CGTGTTCGTG 
CCGCGCGCCA CCGGGGCCGA CGCTGGCGAA TCACCCGAGG ACGACGGCTA TCTGCTCACC 
ATGGTCTACG ACGCCAACAG CCACACCAGC CACCTGGCCG TCTTTGATGC CGGCGATATC 
GAGGCCGGCC CGCGCGCGCG CACGCACTTC GATCACCACA TCCCGCCGCG CTTTCACGGC 
GCGTGGATGC CGGTGAGCCA GTATCCGCAC ATGCGCGGCC GCTGA

Protein sequence

MKELYSTSHA AAANAHAAAD TSPSAAPAHT ADGEGVQAPP WANAFRELTR EHDFQPLRVE 
GVLPPDLEGS FYQNGPVLFS SHGYRYTHWF DGDGGVSAVR LQAGRAHGAA RVTATAGLIA 
EARAGKRLYG GYSSPQPGAV KRLLGILKNT ANTSMLVWNR RLFALMEAGL PTEIAPEDLR 
TLGERDLGAI THVFSAHPHW CARRNTYYGF GVRPGRQQQL DIFELTHTGV ARPLCSVPLS 
EHTLIHDFAI TGRYLVFFAP PFELRAWRML AGEGGYADNL QWKPEYGTEI IVVPIDLPHA 
VQRFRVDPFF HWHVANGFDD GDDIVVDFVR YDDFENNAFL ADLPAGNDTR NLGSRLVRAR 
ISLANTRMRR EERWSRSVEF PQIRQDYFGR PYRYCYLAAY EDGAPDSGLQ NVLAKVDMHS 
GEVREYTCAP GRYLTEAVFV PRATGADAGE SPEDDGYLLT MVYDANSHTS HLAVFDAGDI 
EAGPRARTHF DHHIPPRFHG AWMPVSQYPH MRGR