Gene Cyan8802_3040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan8802_3040
Symbol
ID	8392370
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8802
Kingdom	Bacteria
Replicon accession	NC_013161
Strand	-
Start bp	3075729
End bp	3076883
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	38%
IMG OID	644980989
Product	FO synthase subunit 2
Protein accession	YP_003138721
Protein GI	257060833
COG category	[H] Coenzyme transport and metabolism [R] General function prediction only
COG ID	[COG1060] Thiamine biosynthesis enzyme ThiH and related uncharacterized enzymes
TIGRFAM ID	[TIGR00423] radical SAM domain protein, CofH subfamily [TIGR03551] 7,8-didemethyl-8-hydroxy-5-deazariboflavin synthase, CofH subunit

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.591688
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGATTA GTCAAATCAA AGCCATCGAT AGTATTTTGA ATCAGGTTAA ACTAGGACAG 
GATCTATCGT TAGAAGATGG AGTAACCTTG CTGACTCAGA CAGAAGAAAC AGCTATTGCT 
GATATTCGTG AAACTGCGGA TAAACTGCGT CAAAAACAGG TAGGAGATAC CGTTACTTAT 
ATTATTAATC GTAATATCAA CTTTACTAAT ATTTGCGAAC AACATTGTAA TTTTTGTGCT 
TTTCGACGAG ATCCAGGAGA AGAAGGGTCA TTTTGGTTAA CTATTCCCCA AATTGTTGAA 
AAAGCTGCTG ATGCTGTGGA AAAAAAAGCG ACTGAAATTT GTATGCAAGG GGGATTAAAT 
CCCCAAGCAA AATTAAACGG AACTTCCCTC AATTACTATT TAAAATTAGT TACTACCCTG 
AAAACCGAAT TTCCCCAAAT TCATTTACAC GCTTTTTCTC CCCAAGAAGT CGAATTTATT 
GCGAGAGAAG ATGGAATTAG CTATGCTGAT GTTATTATGG CTTTACGCGA TGCAGGAGTT 
GGTTCTATGC CAGGAACGGC TGCTGAAGTC TTGAATAATC AAGTCAGACG CATTATTTGT 
CCTGAAAAAA TCAAGACAGA AACCTGGGTA GAAATTGTTA GTATTGCCCA TCGTTTAGGA 
GTTCCTACTA CCAGTACCAT GTTATGTGGT CATATTGAAA CTTCTTGGCA ACGAATTGAA 
CATTTATTAC ACTTAAGAAA ACTGCAACAA ACGGCAATAG AAAAAGACTA TCCCGCTAGG 
ATTACTGAGT TTATTTTACT TCCTTTTGTC GGACAAGAAG CTCCCCCATC GTTACGCAAA 
CGGGTGGCAA GAGAACAACC CAGTTTAGAA GATACTTTGT TATTAACGGC TGTTTCTCGA 
CTTTTTTTAG GAAACTGGAT ACCGAATCAT CAACCCAGTT GGGTTAAATT GGGATTAAAT 
GGGGCAGTAG AAGCCCTAAA ATGGGGCTGT AATGATATTG GAGGGACTTT AATGGAAGAA 
CATATCACCA CCATGGCAGG GGCAAAAGGA GGGACTTGTA TGGCAGTAGA AACATTACAA 
CAAGCAATAA AATCGATTAA TCGTCCCTAT CACCAACGAG ATACTATATA TAGCCAGAAA 
TTTAGCTATA TATAG

Protein sequence

MMISQIKAID SILNQVKLGQ DLSLEDGVTL LTQTEETAIA DIRETADKLR QKQVGDTVTY 
IINRNINFTN ICEQHCNFCA FRRDPGEEGS FWLTIPQIVE KAADAVEKKA TEICMQGGLN 
PQAKLNGTSL NYYLKLVTTL KTEFPQIHLH AFSPQEVEFI AREDGISYAD VIMALRDAGV 
GSMPGTAAEV LNNQVRRIIC PEKIKTETWV EIVSIAHRLG VPTTSTMLCG HIETSWQRIE 
HLLHLRKLQQ TAIEKDYPAR ITEFILLPFV GQEAPPSLRK RVAREQPSLE DTLLLTAVSR 
LFLGNWIPNH QPSWVKLGLN GAVEALKWGC NDIGGTLMEE HITTMAGAKG GTCMAVETLQ 
QAIKSINRPY HQRDTIYSQK FSYI