Gene Bcer98_3076 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcer98_3076
Symbol
ID	5343886
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cytotoxicus NVH 391-98
Kingdom	Bacteria
Replicon accession	NC_009674
Strand	+
Start bp	3120103
End bp	3121860
Gene Length	1758 bp
Protein Length	585 aa
Translation table	11
GC content	38%
IMG OID	640840570
Product	phenylalanine 4-monooxygenase
Protein accession	YP_001376295
Protein GI	152976778
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3186] Phenylalanine-4-hydroxylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAAGA CAGAAATTCC AGCGCATTTA AAGCCTTTTG TGTCTAAGCA ACATTATGAT 
CAGTACACAC CCATTAATCA TGCTGTATGG CGCTATATTA TGAGGCAAAA CCATAACTTT 
CTAAAAGATG TGGCTCATCC AGCTTATGTG AACGGATTAA AATCATCTGG TATTAATATA 
GACGCAATTC CAAAAGTGGA AGAAATGAAT GAATGTTTAG CACCAAGCGG TTGGGGAGCT 
GTAACGATTG ATGGTCTGAT TCCCGGAGTC GCATTTTTTG ACTTTCAAGG TCATGGTTTA 
CTACCAATCG CAACAGATAT TCGCAAAGTA GAAAATATTG AATATACACC AGCACCTGAT 
ATCGTTCATG AAGCAGCAGG TCATGCTCCC ATCTTACTTG ATCCTACATA TGCCAAGTAT 
GTAAAACGCT TTGGACAAAT TGGAGCAAAA GCTTTCTCAA CAAAGGAAGA GCATGATGCC 
TTTGAAGCAG TTCGTACACT CACCATTGTA AAAGAAAGTC CAACTTCAAC ACCTGAAGAA 
ATTGAAGCAG CGGAAAAAGA AGTAATCGAA AAACAAAAAC TAGTTTCAGG TGTATCAGAA 
GCGGAACAAA TTTCTCGCCT TTTTTGGTGG ACAGTTGAAT ATGGACTGAT TGGCGATCTA 
GACAATCCTA AAATTTACGG AGCTGGTCTA CTGTCTTCTG TAGGCGAAAG TAAGTATTGT 
TTAACAGATG CTGTTGAAAA AGTTCCATTC TCGCTCGAAG CTTGCATAAA GACAACATAC 
GATGTGACGA AAATGCAGCC GCAATTATTT GTCTGTCAGT CATTTGAAGA ACTGATAGAA 
GCACTTGAAG CATTTTCTAA AACAATGGCT TTTCAGACGG GTGGTGCGGA AGGATTAGAA 
AAAGCAATTC GCTCTGAAAA CATAGCGACT GCTGAACTAA GTAGTGGTTT ACAAATTACA 
GGTACATTCT CAGAGATGGT GCAAAATGAG GTTGGTGAAG TAATTTATCT AAAAACCAAT 
ACACCAACCG CTTTAGCATT CAATCATAAG CAACTGCCTC ATCACTCAAC AGCTATACAC 
GAAGATGGAT TTGGTACACC AATTGGTTTA TTGCAAAACA ATATAGCATT AGAAGATTGT 
ACAGAGGAAT CTTTACAATC ATTAGGTATT CTAATTGGAA ACAATACTGA TCTTTCCTTT 
GCAAGCGGTG TTCACGTAAA AGGAACTGTA ACTGATATTA TAAAACAGGA TGAGAAAGTC 
GTTCTTATTT CCTTTACAAA TTGCACTGTT GTTTATAAAG ATCGCTTATT ATTTGATGCT 
TCATGGGGAA CATTTGATAT GGCAGTTGGT TCTAACATTA CATCTGTATT CCCAGGTGCA 
GCCGATGCAG CCTCATTCTT CCCCATGGAT GAAGAAATAG AAAAAACCCC CGCACCACTT 
TCACTATCAG AGCTAGATCG TATGTATCAA ATGGTTCGAG ATATTCGAAA TAAAGGTGAG 
CTGCAAGATT CAGATGTAGC ACAATTAGTA GCCATACATG AAGTATTAAA TCAATTCTAT 
AAAAAAGAAT GGCTACTCCG CCTTGAAATA TTAGAGTTAC TTGTGGAACA TAACAAAGAT 
CAAAAAACAG CCTCTTTCTT ACTGCAACAA CTCTCTACAT TTACAGAAAA TGAGTCTGTA 
CAACGTTTAA TCCATAATGG ACTTGCTTTA CTTCCAATAA AGGATGTGAA AAATAATGCA 
ACGATTAACA GATCATGA

Protein sequence

MKKTEIPAHL KPFVSKQHYD QYTPINHAVW RYIMRQNHNF LKDVAHPAYV NGLKSSGINI 
DAIPKVEEMN ECLAPSGWGA VTIDGLIPGV AFFDFQGHGL LPIATDIRKV ENIEYTPAPD 
IVHEAAGHAP ILLDPTYAKY VKRFGQIGAK AFSTKEEHDA FEAVRTLTIV KESPTSTPEE 
IEAAEKEVIE KQKLVSGVSE AEQISRLFWW TVEYGLIGDL DNPKIYGAGL LSSVGESKYC 
LTDAVEKVPF SLEACIKTTY DVTKMQPQLF VCQSFEELIE ALEAFSKTMA FQTGGAEGLE 
KAIRSENIAT AELSSGLQIT GTFSEMVQNE VGEVIYLKTN TPTALAFNHK QLPHHSTAIH 
EDGFGTPIGL LQNNIALEDC TEESLQSLGI LIGNNTDLSF ASGVHVKGTV TDIIKQDEKV 
VLISFTNCTV VYKDRLLFDA SWGTFDMAVG SNITSVFPGA ADAASFFPMD EEIEKTPAPL 
SLSELDRMYQ MVRDIRNKGE LQDSDVAQLV AIHEVLNQFY KKEWLLRLEI LELLVEHNKD 
QKTASFLLQQ LSTFTENESV QRLIHNGLAL LPIKDVKNNA TINRS