Gene Haur_2227 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_2227
Symbol
ID	5734114
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	2830898
End bp	2832262
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	52%
IMG OID	641279368
Product	cytochrome P450
Protein accession	YP_001544995
Protein GI	159898748
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGCTTG CTGTTCGTTC GCTGCCGCAT CGGCGCAGCC GTTTTGCGCT CGATATTGCG 
CTCGAAGTTA AACGCCAAGG CACATTACAA TTTTTTGAAT CGACGTGGCG ACGCTATGGC 
GACCTTGCCC ACCTGCAACT TGGCTCAAAA GATATGTTTT TGGTGGTGCA TCCTGATCAC 
GTTCGGCGGG TGATGGTCGA GCAGCGTGAC ACTTATTCAA AAAAGGCTAG CTATGAAGGT 
GTGCGCAAAT TATTGTTAGG CGATGGCTTG GTAGCCAGCA CTGGCAGCCT TTGGCGGCGG 
CAGCGCAAAT TGATGGCTCC ATTTTTCACG CCACGGGCAA TTGAAACCTA TTTACCAATT 
ATTGTTGAGG ATGGGGCATG GTTTCGCGAA CGTTGGAGCG CTGCTGCCAA ACAGGGCGAA 
CCACTCGATA TTCTGACCGA AATGTCGGTG CTCACAGCGT CGATCATCTT AAAAAGTATG 
TTTAGCCTTG AGGCCGATGA CACGATTGCT TGGGTCAAAC ATGCGGTCGA AACGATGATT 
GGCTTTGCCT CAAGCCGCCA GATGAACCCA CTGCATGCGC CACTCTGGAT GCCAACGCCC 
AAAAATCGGG CTTATTTGGA AGCTCGCAAC CGGGTTAATC AGTATATTCA GGGCATTATC 
GCCGAGCGCC AACGCCAAGC GCCGGATGAA TGGCCTAACG ATTTGCTAAC CCGCATGATG 
CAGGCTCGCG ACGAAGAAAC AGGCGAACCA ATGTCTACAG TTTTGTTGCG TGATGAGGCA 
ATTACGGTCT TTTTTGCTGG CCACGAAACC ACCGCCCGCA CGCTATCATT CTTGTGGTAT 
GCCTTGGCCA ACAATCCCGA CGTTGCCGAA CGCATGCAGG CCGAAATCGA TAGTGTGTTA 
GGCGATGCTG CACCAACTCT CGATCATCTC AAACAACTGC CTTATACCTT GCAAGTAATC 
AAAGAAACCT TGCGACTTTA CCCCGCCGCC CCGATGTATG CCCGTGATGC GGTTGCTAGT 
GATGAATTTG CAGGCATTAA GGTTCCAGTT GGCTCACGGA TGACGATCAT GCCCTATCTT 
ACCCATCGCC ACCCTGATTT TTGGGATAAG CCGTTGCGCT TTGATCCTGA TCGTTGGTTG 
CCAGAACGCG AAGCCCTGCG CCACCCCTTT GCCTATCACC CATTTGCGGC TGGGCAGCGG 
ATTTGCATCG GCAATAATTT TTCGTTGTTT GAATCGCATG TGGTGGTTGC GATGCTGGCC 
CGCCATTTTG CCCTGCGCAC CGTGCCAAAT CACACGCCGC AAGTCTGGAT GGATGGCACA 
CTTGGCTCGC GCAATGGCTT GCCAATGTTC ATCACCCAGC GCTAA

Protein sequence

MTLAVRSLPH RRSRFALDIA LEVKRQGTLQ FFESTWRRYG DLAHLQLGSK DMFLVVHPDH 
VRRVMVEQRD TYSKKASYEG VRKLLLGDGL VASTGSLWRR QRKLMAPFFT PRAIETYLPI 
IVEDGAWFRE RWSAAAKQGE PLDILTEMSV LTASIILKSM FSLEADDTIA WVKHAVETMI 
GFASSRQMNP LHAPLWMPTP KNRAYLEARN RVNQYIQGII AERQRQAPDE WPNDLLTRMM 
QARDEETGEP MSTVLLRDEA ITVFFAGHET TARTLSFLWY ALANNPDVAE RMQAEIDSVL 
GDAAPTLDHL KQLPYTLQVI KETLRLYPAA PMYARDAVAS DEFAGIKVPV GSRMTIMPYL 
THRHPDFWDK PLRFDPDRWL PEREALRHPF AYHPFAAGQR ICIGNNFSLF ESHVVVAMLA 
RHFALRTVPN HTPQVWMDGT LGSRNGLPMF ITQR