Gene Hoch_2967 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_2967
Symbol
ID	8545355
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	4079133
End bp	4080437
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	73%
IMG OID	646387644
Product	cytochrome P450
Protein accession	YP_003267372
Protein GI	262196163
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.00303691
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCGGTCG ATTCCACCAA CCGCCCCCCC GCGTCCGAAA CCGCTCACTC GTCCCCGACC 
GCCGGGGCGC TGCCGGCGGT GCTGGAGGGC TTCGATCTGA GCGATCAGCC GCGCTTCGCC 
GACGGCTTCC CGTACGAGGT GTTCGCGCGC CTGCGCCGCG AGGCCCCGGT GCTGTTCCAC 
CCGCCGGGCC AGACCAAGGA CGGCGAGGGC TTTTGGGTGC TGAGCCGGCA CGCCGATATC 
TGCGAGGCGG CCGCGAGCCC GGCGTTCTCG TCCCAGGGGG GCGGCGGGCG GCCGCACGGC 
GGCACGCACA TCGACGACGC GCGCCCCGAG CTGCCCGGCG TGCTGATCAA CATGATGGAC 
GACCCGCGCC ACGCCGACCT CAAGGACGTG CTGTCGCCGG CCGTGGGCCG GCAGGCGCTG 
GTCGCGCTCG AGGGCGCGCT GCGGCCGTAC GTGAACGAGC TGGTGGACGG GCTGCTGGCG 
CGCGGTGAGG CCGAGTTCGC GGCCGACGTG GGCGCGGCCG TGGGCGCGCG CGCGATCTCG 
CTGCTGCTCG GCATCCCGCG CGAGGACTGG CCGCTGTTCG CGACCTGGAC GTCGGCGCTG 
ATGGGCTTTG ACGATCGCGA GACCGCCGAG CCGTCGGAGC GCAGCCAGAA GATCCACATG 
GACCTGTTCG GCTACGGCGC GCGGCTACTG GTGGCCCGGC GCGCGGCGCC GCAGGAGGAC 
CTCGGCTCGC TGCTGGCCAA CGCGCAGCTC CGGCGCGACT CCGAGCGACC GCTCACGGAG 
CTGGAGCGGC AGACGGCGTT CTGCCTGATG GTGCTCGCCG GGACCGAGTC GACGCGCAAC 
ATGATCGCGG GCGGCGTGCT GGCCCTGGCC CAGCATCCGG CGCAGTGGCA GGCGCTGCGC 
GATGAGCGCT CGCTGCTGCC GAGCGCGATC GACGAGATCC TGCGCTGGAC CACGCCCACG 
CCGTACAACC GGCGCACGGC GACCCGCGAC GTGACGCTCG GCGACGCCCA CATCCGCGCG 
GGCGATAAGG TGACGCTGTG GTGGACCTCG GCCAACCGCG ACGAGTCGGT GTTCAAGGAC 
CCGATGGCGT TCGATGTCCG CCGCGACCCC AACCCGCACC TGGCGTTCGG CTACGGCACG 
CACTGCTGCT TCGGCGACCA GCTCGGCAAG CTGGAGATGC GCCTGGTGCT TGACGCGATG 
CTCGAGCGCG TGGCGCCGCT CGAGCTGAGC GGGCCGGTGG TCTGGGCCGC CAGCAACAAG 
CACACGGTGG TGATGGATAT GCCGGTGGCC GTGCGCGCGC GCTGA

Protein sequence

MSVDSTNRPP ASETAHSSPT AGALPAVLEG FDLSDQPRFA DGFPYEVFAR LRREAPVLFH 
PPGQTKDGEG FWVLSRHADI CEAAASPAFS SQGGGGRPHG GTHIDDARPE LPGVLINMMD 
DPRHADLKDV LSPAVGRQAL VALEGALRPY VNELVDGLLA RGEAEFAADV GAAVGARAIS 
LLLGIPREDW PLFATWTSAL MGFDDRETAE PSERSQKIHM DLFGYGARLL VARRAAPQED 
LGSLLANAQL RRDSERPLTE LERQTAFCLM VLAGTESTRN MIAGGVLALA QHPAQWQALR 
DERSLLPSAI DEILRWTTPT PYNRRTATRD VTLGDAHIRA GDKVTLWWTS ANRDESVFKD 
PMAFDVRRDP NPHLAFGYGT HCCFGDQLGK LEMRLVLDAM LERVAPLELS GPVVWAASNK 
HTVVMDMPVA VRAR