Gene PCC8801_1643 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_1643
Symbol
ID	7102386
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	1718125
End bp	1719687
Gene Length	1563 bp
Protein Length	520 aa
Translation table	11
GC content	48%
IMG OID	643474714
Product	WD-40 repeat protein
Protein accession	YP_002371850
Protein GI	218246479
COG category	[R] General function prediction only
COG ID	[COG2319] FOG: WD40 repeat
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACTTCA AACAATTGCA CTGGCTTGAA GTGGCTGAAT GTTTAGCCTT GGGACTGGCG 
GTGGTTTTCC TCTTGGTGGC TATCGCGTCC CAAGATTGGT TATTACCCTT GGTTTTTTTG 
ACCTTTGGGT TGATTTTTAA TAGCCTTAAC CGCATTCGTT GGCAATATCT GATGCGCCAG 
CGACTTTCAG CGACAACTAA GCAACTCAAG CAACAAATTG CCCAAGAACT CGAAAAGATT 
CAGGTTTCTG CTCCCGTCAC CCCCGCAGAA GAAACAGAAA GCCGCGCGAT CGCCCGTCTA 
CAAGACAATT GCGTCAGTCT GGAGCAATCT CTCAATAGTG TGGTGCAATA CCTCAATACC 
CAAGTGTTAC CCGAAAGAAT CGAACATTTG GAAAAAGCCT ACCTACAATT GAGTCAAGAT 
CTGCGGACAC TGACTCGCCA AGTTGAAGAT CCTTCCGTCG AACCTCTTGC CCCTTCACCG 
CCTGAATTGG AACCCTTTGA CATTTCTTCA GCCACAGGGC TCAATGTTTC CCAAGTAACA 
ACCCAACTTC CCATCGTTGC GCCGACTTCC TTTGTTTCTC AGTCTCCAAG TATCCCGACT 
TGGCAAGAAC TTGACCCCCT GATGGCTCAT GATGATGCGG TTAGTTGTTT GGCCATCAGT 
CCTGACGGAC AATGGCTAGT CAGTGGCAGT TGGGATCAGA CGTTACGGGT TTGGGACTTA 
GCTACCCGAA CCCTAAAAGC TCAAGTGAGT GCCCATTATC AGGGGTTACT CGCGGTGGTG 
GTTGTTCCCA TACAAGCCTC TGGAACGGGT TATCGGATTG TCACAGGGAG TTTTGACCAT 
ACGATTAAGG TCTGGTTAGC GGATACGGAA GATCCTGAGC ATTTGACCCT AACGATTGAG 
GAGACATTAA CCCAACATAC GGGCTCGGTG CAATCTTTGG CTTTATCCTA CAACCCCTTA 
TTATTGGTCA GTGGTAGTTA CGATCAGACG GTGAAACAAT GGCAATTATT AACAGGGGAG 
ATGGTGTGTA GTTCCTATGA TCCTTTGGGG GCAATTTATG CGATCGCAGT TGATACGTCT 
CAGGAGTTAA TTGCTAGTGC CGGAGGAGAT GGCCGAGTCA CGCTTTGGAA ATTGGGGACA 
GGCGAACAAA TTGGCTTTTT AGCGGGGAAT GTCTCTTCAG TGGAGTCTTT GGCTTTTAGC 
CCCGATGGAG AAACCTTAGC GGCCGGTTGT GTCGATGGGA CAATTAAATT GTGGCAACTC 
GATGCTAGTC GTTTTGGGGC TGGTCGTCCG TTGCAACCTG TTCGCATCTT GGAAGCTCAT 
AATGGTCAAG TTAAGGCGCT CCTGTTCAAT GGTGAGGAGC AAATTCTCTT TAGTGGGGGA 
GCCGATGGTT ATGTGAAAAT TTGGCATCCG AGTCGCCGGG AGGCGATCGC AGTTCTGGGG 
GTTAATGAGG GTGCTGAATC CGGCCGTAGT TCGATTTTAT CCTTGGCTTT AAGCGATGAT 
AGTTACTTAT TAATCGCTGG AACGGCTGAT GGCATAATTC AAATTTGGAG AAAAACCGAT 
TGA

Protein sequence

MNFKQLHWLE VAECLALGLA VVFLLVAIAS QDWLLPLVFL TFGLIFNSLN RIRWQYLMRQ 
RLSATTKQLK QQIAQELEKI QVSAPVTPAE ETESRAIARL QDNCVSLEQS LNSVVQYLNT 
QVLPERIEHL EKAYLQLSQD LRTLTRQVED PSVEPLAPSP PELEPFDISS ATGLNVSQVT 
TQLPIVAPTS FVSQSPSIPT WQELDPLMAH DDAVSCLAIS PDGQWLVSGS WDQTLRVWDL 
ATRTLKAQVS AHYQGLLAVV VVPIQASGTG YRIVTGSFDH TIKVWLADTE DPEHLTLTIE 
ETLTQHTGSV QSLALSYNPL LLVSGSYDQT VKQWQLLTGE MVCSSYDPLG AIYAIAVDTS 
QELIASAGGD GRVTLWKLGT GEQIGFLAGN VSSVESLAFS PDGETLAAGC VDGTIKLWQL 
DASRFGAGRP LQPVRILEAH NGQVKALLFN GEEQILFSGG ADGYVKIWHP SRREAIAVLG 
VNEGAESGRS SILSLALSDD SYLLIAGTAD GIIQIWRKTD