Gene PCC8801_3957 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_3957
Symbol
ID	7105822
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	4145143
End bp	4146273
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	47%
IMG OID	643476954
Product	monooxygenase FAD-binding
Protein accession	YP_002374055
Protein GI	218248684
COG category	[C] Energy production and conversion [H] Coenzyme transport and metabolism
COG ID	[COG0654] 2-polyprenyl-6-methoxyphenol hydroxylase and related FAD-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGGAAGA TCATCATTAT CGGGGGTGGA ATTGGGGGCA CTGCAACTGC GCTTGCTCTG 
AATCAAGCAG GTTTTGAGCC TGTCGTTTAT GAGCGCACCC AGGTCTTGCG GGAAGTCGGT 
GCTGGAATTG CACTGTGGGC AAACGCGACT CACATCTTGA AGAAGTTAGG ATTATTGGAA 
ACAGCGATTC AGGTTGGCTG TCTCACCACC AATTATCAAT TCAACTCCCA ACGAGGCAAA 
GAGCTAGTTA ACATCGATCT CGATGGTTTT GAGTTACCTG TTGTGGCCAT TCATCGCGCT 
GAATTGCATC AACTTCTGTG GCGTAATGTA CCTGGAGAAA AATTTCACTT GGGAGAAACG 
TTTGAACGAT TTGAGCACCA GCATGATCGG GTTCATGCCT ATTTTGTCTC TGGATTAGAA 
GTCGAAGGGG ATGGATTAAT CGGTGCAGAT GGATTGCGTT CACGAGTCAG AGCTACTCTT 
TTAGGCGATA CTCCTCCCAC ATACCGGAAT TTCAAAACTT GGCGAGGGTT GACTGATTAC 
GTCCCGAGTA ATTATCGGCC GGGTTACATT CAGGAGTTTT TAGGTGGTGG TAAAGGTTTT 
GGCTTCATGA TGCTGGGCAA AGGAAAAATG TATTGGTATG CCGCAGCTAC CGCACCTGAA 
GCACAACCGG ATGCAGTGTT CGGGCGCAAA CAGGAACTTG AGACAATGTA TCAAGACTGG 
TTTTCAGCGA TTCCTGAATT GATTGCAGCA ACGGATGAGG CAAATATCTT GACCACGGAT 
CTTTACGATC GCCCTCCGAC TCAACCTTGG AGCAAAGGCA ATATTACCCT TTTAGGCGAC 
GCTGCTCACC CAATGTTACC CACAATGGGA CAAGGAGCTT GTACCGCTTT AGAAGATGCG 
TATGTTGTTG CAAAATGCTT AGAAGAAAAT TCTGATCCGA TCGCTGCATT TCAACGCTAT 
GAAGATCTAC GATTTCCTCG CACCAAAGCA ATCGTTGAAC AGTCTTTACG ATCTCGGAAG 
ATGGGTGAAT TGAAGAATCC CTTCGCTGTT AGTCTCCGTA ATACTTCGAT GAAAATCATG 
GGTTCAGCAA TCAGCAGCAG CTTTAAATCT CTTCATGCTT ACCGAGCCTA G

Protein sequence

MRKIIIIGGG IGGTATALAL NQAGFEPVVY ERTQVLREVG AGIALWANAT HILKKLGLLE 
TAIQVGCLTT NYQFNSQRGK ELVNIDLDGF ELPVVAIHRA ELHQLLWRNV PGEKFHLGET 
FERFEHQHDR VHAYFVSGLE VEGDGLIGAD GLRSRVRATL LGDTPPTYRN FKTWRGLTDY 
VPSNYRPGYI QEFLGGGKGF GFMMLGKGKM YWYAAATAPE AQPDAVFGRK QELETMYQDW 
FSAIPELIAA TDEANILTTD LYDRPPTQPW SKGNITLLGD AAHPMLPTMG QGACTALEDA 
YVVAKCLEEN SDPIAAFQRY EDLRFPRTKA IVEQSLRSRK MGELKNPFAV SLRNTSMKIM 
GSAISSSFKS LHAYRA