Gene Haur_0973 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_0973
Symbol
ID	5732874
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	1115891
End bp	1117129
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	53%
IMG OID	641278105
Product	cytochrome P450
Protein accession	YP_001543749
Protein GI	159897502
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACACAAT CACAAGTGCA CATATATGCC GATGATCCAA CGGCGCAGAT TTTTCAGTCC 
AGCGCAATTG AAAATCCGTA TCCGTTGTTT GCCCAAATGC GGGCCAAAGC GGCGGTGCTG 
GCGGTTCCCT CGCCCTATGA ATTTGTCAAA GCCGATGCGT GGCTGGTAAC GCGCTATGCC 
GAAGCAGTCC AAGTATTAAA GGATAGCCGC TTCACGGTCG ATGCAACGAT CCTCAACCCT 
GAGGCTGGCG TATTTGGCCA AACTGCCTCG GAAGGAGCCG AAGATCGCAG CTTCTTGGGC 
GCAAAATCGA TGGTTAGCGC CGATGGAGCC GAACACTCGC GCTTACGCAG TTTGGTGGCC 
AAAGCCTTTA CCCCGCGCTA TATCGAACAG CTGCGCCCAC GCATCCAAGA GCTTGCCGAT 
GAATTGCTTG ATCAGGTGCA GGCTCACGGC ACGATGGATT TGGTGCAAGA TTACGCCTAT 
CCTTTGCCAA TTAACGTTAT CTCCGAAATG CTGGGCGTAC CAACCCATGA ACGCGACCAG 
ATGCGCGAAT GGTCGGACGC ATTGACCAGC CATAGCCCTG AAAGCCAAGG CCAGTTGCGC 
GAATTTGCCA TGTATGTGCA AAAGCTGATC GCTGATAAAC GCCGCAATCC GCAAGCTGAT 
CTGATTAGTA AATTGGTCGA GTTGGAAGCC ACAGGCGATG CCCTCAGCGA ATCAGAATTA 
TTGGCAACCG CAGGCTTGTT AATTTTTGCG GGCCACGAAA CCACCTCGAA TTTAATCAGC 
ATTGGCTCGT TGATGTTGCT TGATCATCCT GAGCAACGCG CTCGCTTGCA AGCCGATCCC 
AGCCTTATTC CAACAGCCGT CGAAGAATTA TTGCGCTTCA ATGGGCCAAT CTTTAGCCCT 
GCCCCACGTT TTGCGCTCGA AGATGTGGAG ATCGCAGGTC AGCCGATTCG CCGTGGCGAT 
TTGGTGTTGG TGGCGCTTGG CTCGGCCAAC CACGATCAAA GCGTTTTCAA CGATCCTGAA 
TCATTGGATG TGGCGCGTGA AATTAGCCGC CAACTCGCTT TTGGCCATGG CGTGCACTTC 
TGTTTGGGTG CGCCGCTCGC TCGCTTAGAA GCTGAAATCG CTTTCACCAG CTTATTGAAA 
CGCATGCCCA ACTTACAGTT AGCTGTGCCA CGCGAACACA TTCAGTGGCG CGATAACGTG 
AATTTACGGG GTCTCAAAGC CCTCCCTGTG ATCTTCTAG

Protein sequence

MTQSQVHIYA DDPTAQIFQS SAIENPYPLF AQMRAKAAVL AVPSPYEFVK ADAWLVTRYA 
EAVQVLKDSR FTVDATILNP EAGVFGQTAS EGAEDRSFLG AKSMVSADGA EHSRLRSLVA 
KAFTPRYIEQ LRPRIQELAD ELLDQVQAHG TMDLVQDYAY PLPINVISEM LGVPTHERDQ 
MREWSDALTS HSPESQGQLR EFAMYVQKLI ADKRRNPQAD LISKLVELEA TGDALSESEL 
LATAGLLIFA GHETTSNLIS IGSLMLLDHP EQRARLQADP SLIPTAVEEL LRFNGPIFSP 
APRFALEDVE IAGQPIRRGD LVLVALGSAN HDQSVFNDPE SLDVAREISR QLAFGHGVHF 
CLGAPLARLE AEIAFTSLLK RMPNLQLAVP REHIQWRDNV NLRGLKALPV IF