Gene PCC8801_2626 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_2626
Symbol
ID	7105847
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	2715869
End bp	2716939
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	47%
IMG OID	643475667
Product	monooxygenase FAD-binding
Protein accession	YP_002372786
Protein GI	218247415
COG category	[C] Energy production and conversion
COG ID	[COG0644] Dehydrogenases (flavoproteins)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGTCATTA TCGGTGGGGG TCCGGCCGGG TTAGCAACGG CGATCGCTCT CACCGATCTT 
GACATCAATT CTATCGTGAT CGAGAGCAGC CATTATCTTG ACCCTCGTTT GGGAGAACAT 
CTGACCCCGG TCGGGGTGGG AATCTTAAAA CAACTAGGGA TCTGGGATAG CCAATTTCTA 
GAAAAACACC GTTTATGTTA TGGGGTGCGT TCTGCTTGGG GAGAGACTCA AGTGACCTAC 
AGTGACTACC TCTTTCATCC CGATGGTACG GGAGTTAATT TGAGTCGTCC CACCTTTGAC 
CGCAATTTAG CAACGTTAGC GGATGGTAAG GGGGTTCGTT TGTTGCTCTC AAGTCAACTC 
AAACAGGCTC AACAGGAACA GAACGGATGG ATACTTTCTC TCGACACTCC AAAGGGTCTT 
CAGGAGGTAA GAGCTAGAGT GGTTGTGGAT GCGAGTGGAC GCAAGGCTTT ATTTGCTAGG 
AGTCAGGGTC GAACTTCTGT CTATTGCGAT CGCTTGGTGG GTATTGCTGC TTTTTTAGAG 
CCTTTGGCAG AAAATCATGA TCAGGAGGAA ACCTTGTTGC TCGAATCGGG AGAGTTTGGC 
TGGTGGTACT TTGCCCGTCT TCAGGATAAT AGGGGGGTTT TTTTGCATAT AACGGATGCT 
GATCAACTTG AGTCCAGAAA AGATGCTCCT CTGCAAACGT GGTCAAAACG GCTAAAATCA 
ACTAACTTTT TCTCGGAACT GGCTGGTTAT TATCATCCTG TTGAAAAGGT TCTGGTGCGA 
TCGGCTCGTA GTCATTGTCT TGATCAAGCA ACAGGTCATC ATTGGCTGGC TGTGGGGGAT 
GCTGCCATGA GTTTTGATCC CTTATCGTCT ATGGGGATTA CTAAAGCTTT AAAGGCTGGT 
ATTTTTTCGA GTCAAGTCAT TTTAAGGGTT TTGAATGGGG AAACAACGGT TCTGAAAGAC 
TATGAGGCAG AAATTCAGCA ACAATTTAAC GAATATCTCC AGATTCGCAC TCAATATTAT 
CAGATCGAGC AGCGTTGGCC AAGCTCACTT TTTTGGCAGC GGCGACATTA G

Protein sequence

MVIIGGGPAG LATAIALTDL DINSIVIESS HYLDPRLGEH LTPVGVGILK QLGIWDSQFL 
EKHRLCYGVR SAWGETQVTY SDYLFHPDGT GVNLSRPTFD RNLATLADGK GVRLLLSSQL 
KQAQQEQNGW ILSLDTPKGL QEVRARVVVD ASGRKALFAR SQGRTSVYCD RLVGIAAFLE 
PLAENHDQEE TLLLESGEFG WWYFARLQDN RGVFLHITDA DQLESRKDAP LQTWSKRLKS 
TNFFSELAGY YHPVEKVLVR SARSHCLDQA TGHHWLAVGD AAMSFDPLSS MGITKALKAG 
IFSSQVILRV LNGETTVLKD YEAEIQQQFN EYLQIRTQYY QIEQRWPSSL FWQRRH