Gene Cyan8802_4002 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan8802_4002
Symbol
ID	8393352
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8802
Kingdom	Bacteria
Replicon accession	NC_013161
Strand	-
Start bp	4119120
End bp	4120250
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	47%
IMG OID	644981923
Product	monooxygenase FAD-binding
Protein accession	YP_003139637
Protein GI	257061749
COG category	[C] Energy production and conversion [H] Coenzyme transport and metabolism
COG ID	[COG0654] 2-polyprenyl-6-methoxyphenol hydroxylase and related FAD-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGAAGA TCATCATTAT CGGGGGTGGA ATTGGGGGCA CTGCAACTGC GCTTGCTCTG 
AATCAAGCAG GTTTTGAGCC TGTCGTTTAT GAGCGCACCC AGGTCTTGCG GGAAGTCGGT 
GCTGGAATTG CACTGTGGGC AAACGCGACT CACATCTTGA AGAAGTTAGG ATTATTGGAA 
ACAGCGATTC AGGTTGGCTG TCTCACCACC AATTATCAAT TCAACTCCCA ACGTGGCAAA 
GAGCTAGTTA ACATCGAGAT CGATGGTTTT GAGTTACCTG TTGTGGCCAT TCATCGCGCT 
GAATTGCATC AACTTCTGTG GCGTAATGTA CCTGGAGAAA AATTTCACTT GGGAGAAACG 
TTTGAACGAT TTGAGCACCA GCATGATCGG GTTCATGCCT ATTTTGTCTC TGGATTAGAA 
GTCGAAGGGG ATGGATTAAT CGGTGCAGAT GGATTGCGTT CACGAGTCAG AGCTACTCTT 
TTAGGCGATA CTCCTCCCAC ATACCGGAAT TTCAAAACTT GGCGAGGGTT GACTGATTAC 
GTCCCGAGTA ATTATCGGCC GGGTTACATT CAGGAGTTTT TAGGTGGTGG TAAAGGTTTT 
GGCTTCATGA TGCTGGGCAA AGGAAAAATG TATTGGTATG CCGCAGCTAC CGCACCTGAA 
GCACAACCGG ATGCAGTGTT CGGGCGCAAA CAGGAACTTG AGACAATGTA TCAAGACTGG 
TTTTCAGCGA TTCCTGAATT GATTGCAGCA ACGGATGAGG CAAATATCTT GACCACGGAT 
CTTTACGATC GCCCTCCGAC TCAACCTTGG AGCAAAGGCA ATATTACCCT TTTAGGCGAC 
GCTGCTCACC CAATGTTACC CACAATGGGA CAAGGAGCTT GTACCGCTTT AGAAGATGCG 
TATGTTGTTG CAAAATGCTT AGAAGAAAAT TCTGATCCGA TCGCTGCATT TCAACGCTAT 
GAAGATCTAC GATTTCCTCG CACCAAAGCA ATCGTTGAAC AGTCTTTACG ATCTCGGAAG 
ATGGGTGAAT TGAAGAATCC CTTCGCTGTT AGTCTCCGTA ATACTTCGAT GAAAATCATG 
GGTTCAGCAA TCAGCAGCAG CTTTAAATCT CTTCATGCTT ACCGAGCCTA G

Protein sequence

MRKIIIIGGG IGGTATALAL NQAGFEPVVY ERTQVLREVG AGIALWANAT HILKKLGLLE 
TAIQVGCLTT NYQFNSQRGK ELVNIEIDGF ELPVVAIHRA ELHQLLWRNV PGEKFHLGET 
FERFEHQHDR VHAYFVSGLE VEGDGLIGAD GLRSRVRATL LGDTPPTYRN FKTWRGLTDY 
VPSNYRPGYI QEFLGGGKGF GFMMLGKGKM YWYAAATAPE AQPDAVFGRK QELETMYQDW 
FSAIPELIAA TDEANILTTD LYDRPPTQPW SKGNITLLGD AAHPMLPTMG QGACTALEDA 
YVVAKCLEEN SDPIAAFQRY EDLRFPRTKA IVEQSLRSRK MGELKNPFAV SLRNTSMKIM 
GSAISSSFKS LHAYRA