Gene Haur_3072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_3072
Symbol
ID	5734944
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	3879388
End bp	3880758
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	52%
IMG OID	641280216
Product	cytochrome P450
Protein accession	YP_001545838
Protein GI	159899591
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.863931
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTGTTC AACAGATGCT CTGGAAGAGT GGCCCAACCG ACGCGCCATT GCCCCCGGTT 
GCTGATGGCT CGTTTTTGGT GGGTAGTTTA CAGGCAATGC TCAGCGATCC CATTGATTTT 
TTCGTTAAGC AATATCAAAA ATTTGGCCCG ATTTTTCGCG TCAAAGCCCT CAATAATAAA 
TTTACTATCT TGGCTGGGCC TGAGGCCTGC CTCTTTTTAG CCCGTGAAGG CACTAAGCAC 
TTTAGCTCGT GGGAAACATG GCACTCAATG GATGCTGAAA TGGGTGCTTC GAAATCGCTG 
ATTAGCGTCG ATGGCGAGCA ACATTCGCGA CTGCGAGCCT TGCAAAAACG CGGTTATAGC 
CGCCAAACGA TTGAAACGCA ATTTCCCGAA GTGCTCAAGG TCGTTCATGG CTTCTTGGAT 
CAATGGCAGG TTGGCACATC GAAAGCTACG GTAACTCAAC TCCAACGGTT GATTACCGAT 
GAATTGGGGA TGTTGATTGC GGGCCAAGGC CCAGGTGATT ATATTGATGA TGTGCGGACA 
TTTGTTCGAA TTGCGCTCAT GACCCACATC ACGCGCCAAC GCCCAAGCAT TTTGCGCATG 
TTGCCTGAAT ATCGCCGTGC CCGCGACCGC AGCTTGGAAT TAAGTAAGCA GGTGCTGAAA 
GCTCATCGAA GCGGCACACG CGATGCCAAC CGCCCGCCCA GCCTGATCGA CGATATTATC 
GCCGCGACCA ATGACCCGAG CTTAATGCCT GAGGGCGATT TGGTTATGAC TGCCTTGGGG 
CCATACATCG CAGGCTTGGA TACGGTTGCC AACACCATGG CGTTCTTGTT GTATGTGCTG 
ACCACCAAGC CCGAGCTATA CGAACAAGTT GAGGCCGAAG CCGATGCACT GTTTGCCAAT 
GGTGTGCCCG ATCCAGCCGA TTTGCGCAAA ATGGAAGTGT TGCATCGCGT AGTGCTCGAA 
AACTTCCGCA TGTATCCAAT CGCGCCAGCC GTACCGCGCA CCGTCAAAGC ACCATTTGAG 
TTTGGTGGCT ATCGCGTCGA TGCAGGCACA CGAACCTTAG TAGCAACTAC GGTCGGCCAT 
TTCTTGCCCG AACTCCACCC TGAGCCAGAA AAATTCGATA TTGATCGCTA TTTGGCTCCG 
CGTAACGAGC ACCGCATTCC TGGGGCATTT GCACCATTTA GCACTGGCTC GCACACCTGT 
TTGGGCGCTG GCCTAGCCGA AGTCCAAATT ATGCTGACCA CTGCTGCCCT GTTGCACTAT 
GCCAAGTTCG AAGCTGATCC AATCGATTAT AAGCTGAAGA AAGTTTTTGC CCCAACCCCA 
GCCCCCGACA GTAGCTTCAA ATTGCGCTTG GTCACACGCC GTAACAGCTA A

Protein sequence

MTVQQMLWKS GPTDAPLPPV ADGSFLVGSL QAMLSDPIDF FVKQYQKFGP IFRVKALNNK 
FTILAGPEAC LFLAREGTKH FSSWETWHSM DAEMGASKSL ISVDGEQHSR LRALQKRGYS 
RQTIETQFPE VLKVVHGFLD QWQVGTSKAT VTQLQRLITD ELGMLIAGQG PGDYIDDVRT 
FVRIALMTHI TRQRPSILRM LPEYRRARDR SLELSKQVLK AHRSGTRDAN RPPSLIDDII 
AATNDPSLMP EGDLVMTALG PYIAGLDTVA NTMAFLLYVL TTKPELYEQV EAEADALFAN 
GVPDPADLRK MEVLHRVVLE NFRMYPIAPA VPRTVKAPFE FGGYRVDAGT RTLVATTVGH 
FLPELHPEPE KFDIDRYLAP RNEHRIPGAF APFSTGSHTC LGAGLAEVQI MLTTAALLHY 
AKFEADPIDY KLKKVFAPTP APDSSFKLRL VTRRNS