Gene Cyan8802_3914 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan8802_3914
Symbol
ID	8393264
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8802
Kingdom	Bacteria
Replicon accession	NC_013161
Strand	-
Start bp	4029995
End bp	4031095
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	38%
IMG OID	644981839
Product	WD-40 repeat protein
Protein accession	YP_003139553
Protein GI	257061665
COG category	[R] General function prediction only
COG ID	[COG2319] FOG: WD40 repeat
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.152653
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.245593
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAAAT TAGTTAAAAA ATTTCAATTT ATCTATTTAT TTTACTTAGT CGCAAATATT 
AGTTTAATAG CAACATTAGT CTATGAGATT TTAACGCCAA CAACCATTGC TAGAGAGATT 
TACCTTGAAG AAATTGCCCA AAGTTCTCAA CCGCCAATAA TGGTTAAAGA TATCCAAGGA 
TTTAAGGGGG TTATCAAAGC TCTGACGATG ACTCCCGATG GCAAAATCTT GTTAGTTGGT 
GCGGGGGATG CAACCCTTAA TGCAGTTGAT CTTGAACTCG AACAAGTCGT TTATTCTAAA 
ACCCATAAAA TCAATGATTA TTCATCAATT GTGGTGACAT CTCAGCCAAC ATTTCTTGAT 
GAAACGACAT CTAATGAAAC GACCTCTGAT GAGACTCCAT TAACTGGACC AATGTTAGCA 
TTAGCGGATG ATGAAAACAT CAGAGTTTTG AGTTTAGTAG ATGGCAGTAA AGTCAACCTT 
TTAAAAGGAC ATAGTGGAAA AATTAGTGAT TTAGCCCTCA GTCCTGATGA TAAAATACTG 
GTTAGTGTTA GTGCTAGCGA TCGCACCATT CGGATTTGGG ATTTTGCAAC CGGGAATTTA 
ATTGAAACCT TAGGGGTAGA CATTGGACCG ACGAATAATG TCGCGTTTAC TCCCGATGGA 
ATGACGTTTG TCACGGGAGC TATTGGCGAT GATCGCACCT TAAAATTTTG GGATCTCCCT 
ACCTTAGAAT TGATCCGATC TTCTCCCCAA CAACCCGGCT ATATTAACGA TCTCAAGATT 
ACTCCCGATG GCAAAAAATT AGTAGCTGCG GTGAGAAATT ATATCAAAGT TTGGGACTTA 
ACCACGGGGA AAGAACTCTT AAATATTAAA GGACCCAGGT TAGACATTAA TGCGATCGCT 
ATTTCTCCAG ATAGTCGCGT AGTTGCCACT GCCAACAAAG AAGGAAATAT TATGCTTTTT 
GATCTCACAA AAGGTCGTAA ATTAACGACC TTAGAAGGAC ATAAAGGATG GGTTCTTTCT 
TTAGTTTTTA GTCCCGATGG ACGCTATCTT TATAGTGGGG CTGAAGATAA AATTATTAAA 
ATTTGGCAAC TCCGTGCTTA A

Protein sequence

MNKLVKKFQF IYLFYLVANI SLIATLVYEI LTPTTIAREI YLEEIAQSSQ PPIMVKDIQG 
FKGVIKALTM TPDGKILLVG AGDATLNAVD LELEQVVYSK THKINDYSSI VVTSQPTFLD 
ETTSNETTSD ETPLTGPMLA LADDENIRVL SLVDGSKVNL LKGHSGKISD LALSPDDKIL 
VSVSASDRTI RIWDFATGNL IETLGVDIGP TNNVAFTPDG MTFVTGAIGD DRTLKFWDLP 
TLELIRSSPQ QPGYINDLKI TPDGKKLVAA VRNYIKVWDL TTGKELLNIK GPRLDINAIA 
ISPDSRVVAT ANKEGNIMLF DLTKGRKLTT LEGHKGWVLS LVFSPDGRYL YSGAEDKIIK 
IWQLRA