Gene Cyan8802_4301 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan8802_4301
Symbol
ID	8393653
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8802
Kingdom	Bacteria
Replicon accession	NC_013161
Strand	+
Start bp	4440648
End bp	4441739
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	37%
IMG OID	644982211
Product	Tetratricopeptide TPR_2 repeat protein
Protein accession	YP_003139922
Protein GI	257062034
COG category	[N] Cell motility [R] General function prediction only [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG3063] Tfp pilus assembly protein PilF [COG4783] Putative Zn-dependent protease, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.124533
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTCGCC AAACAACCCT ACCCTGGTTA GTAAGTGTAT TCGTAATGGG TTTAACTTTA 
CCCGCGAATG CTCAACTTCA ACCTCCATTA ATTTTAGCGC AACAATCAAC TGACTCAGAG 
GAACTCAAAG AATTGTTGCG TTTAGGTCGA GAATATGTTG ATCTTAAAGA CTATAATAGC 
GCGATCGTAA CCTATGAGAA GGCAGCTATT CTTGATGGCA ATAATGCTAA AATTTTCTCA 
GGAATCGGTT ATTTGTACGC CCAAAAAGGG AACTTTAGAC AAGCCGTTAA GGCCTATCAA 
CAAGCCGTTA CTCTTGATCC TAATAATGCT GATTTTTATT ACGCTCTAGG GTTTAGTTTA 
GCGAATATAG GAGATAATGA AAATGCGGCT TCTGCTTATT ATTATGCGAT TCAACTTGCT 
CCACGAGTGA CGAAAAATTA TATTGGATTA GGGGTAGTTT TATTACGTCA AAATGATTAT 
CAAGGAGCAG CAGAAGCTTA TAAACGAGTG ATTGCCCTTG ATCCCAATAA TTCAGAAGCT 
TTTGCTATTA TGGGTTCTTC TTTGATTCAA CAAAAAGAAC TTGATAAAGC CATTCAATAT 
CTCAATAATG CGGTTAAAAG ATTTCCTAAT GATCTGGAGT TAAGATTATT ATTAGCAACG 
GCTTTTTTAG AACAAGATAA TAACGAACTC GCCTTTAATC AGTTAAAGAG TGCTGAAAGA 
ATTAGCCCGG GAAATCCTAA AGTTCAGTTG AAAATTGGCC GCATTTTAGA ACAACAAAAC 
AAGTTGGATG ACGCGCTTAA AACCTATCAA CGGATTACTT ATTTATCCCC TAGTTCAACG 
GAAGCGCGTG CGGGAGTTGG TAGAATACAA CTAGCTACTA AAGATTATCT AGGTGCAGTT 
ATCACTTATC GAGAATTAGC GTCAATGCTT CCTGAAACTC CTGAACCTTA CTATTATTTG 
GGATTAGCTT ATAAGGAGCG GGGACGAAAA AAAGAAGCGA CTAAAGCGTT AGAACAAGCA 
CGTCAATTGT ATCAAAAACA AGACAATAAT AAGGGCATTG AGGAAGTTGA TAAATTACTT 
AAACAATTGT AG

Protein sequence

MVRQTTLPWL VSVFVMGLTL PANAQLQPPL ILAQQSTDSE ELKELLRLGR EYVDLKDYNS 
AIVTYEKAAI LDGNNAKIFS GIGYLYAQKG NFRQAVKAYQ QAVTLDPNNA DFYYALGFSL 
ANIGDNENAA SAYYYAIQLA PRVTKNYIGL GVVLLRQNDY QGAAEAYKRV IALDPNNSEA 
FAIMGSSLIQ QKELDKAIQY LNNAVKRFPN DLELRLLLAT AFLEQDNNEL AFNQLKSAER 
ISPGNPKVQL KIGRILEQQN KLDDALKTYQ RITYLSPSST EARAGVGRIQ LATKDYLGAV 
ITYRELASML PETPEPYYYL GLAYKERGRK KEATKALEQA RQLYQKQDNN KGIEEVDKLL 
KQL