Gene PCC8801_3366 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_3366
Symbol
ID	7103020
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	3514629
End bp	3515894
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	46%
IMG OID	643476381
Product	pentapeptide repeat protein
Protein accession	YP_002373490
Protein GI	218248119
COG category	[S] Function unknown
COG ID	[COG1357] Uncharacterized low-complexity proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGACCC CAGAGACACC AGACACTCTC CCTCAACAAA ATGGTCAGAA AGCCACTCCA 
TCCCTGCCAG AGAAAATAGA GTCTTTGTAT CCATCGGGTC TACCGTTCTC TAAGACACTA 
TTGCCTCCCC CTAACTCAGA ACCCCAACCC CTCTATCTAC GGGACGTAAA ATCTTTTAAT 
CCTTGGCTAC TGTTGAGTTC AGCCGTCATC ATGATAGTAG GATTAGAGTT TAATTTCCCG 
TGGTTGGGCT TTTCGGCAGC TTTGTTGTCC CTTTTTCTCT CGCTTCAGGT GATTTTACCC 
TCACTACGAG GATGGGTCAT TCGCTATTTA ACTCCCCAAG AACGACAAAC CTTGTTAGGA 
TTTTTGGTGT TTATTGCAGC GATCGCCGGA TTAGCTTATT ATTTTGGATT CTACGATCGC 
CTCAGAATTT GGCTTAATCA GTTCAAATAC GATGAATTTG GCTCTTGGGC TGAATGGGTG 
GGCGCATTGG GTCAAATTAT GATTGCCTTA CTCGCGGTTT ATATCGCTTG GGCACAATAC 
GTCATTTCTA AGGATTTAAC CCTCCAACAA AACCTGATTA CCCAACAACA AACCATTGAT 
ACCTATTTTC AGGGGATCTC CGACCTAGTG TTGGATGGCG AAGGAATGCT CGAAGACTGG 
CCTCAAGAAC GATCTATCGC TGAAGGCAGA ACCGCCGCTA TTTTCAGCAG CGTAGATGAA 
ACAGGAAAAG CCAAAATTTT GCGTTTTCTG TCCCAGTCTC GATTATTAAC TCCTTTAATG 
CGCGATAGTC GCTTAGGAAG ACCTATCCTC GATGGAGCAG GGGGATACGC TGAAGATCGT 
CCATCAGGGG TGCGGGTGAT TAACTTAGGG GTGATGTTAG CAGGGGCTAA ACTATCCGGT 
CAAGATTTAC GCTGGACAGA TTTAAGCGAA GCCAATATGG TACGCGCTGA TTTAAGTCAC 
TGTGACTTGG TTAAAGCCAA TTTATCCCGC ACGGTTCTCT ATGATGGCAA CTTAAAAGGA 
GCCGATCTCA AAGGGACTCG TTTGTTCTAT GGCTCAGTGG AAACGGCTAG TCCGCGATCG 
CGTAGTGCCC CCCCAGACTA TGAAACGGGA GCCTATACCG GGGTCGTTTT AGAAAATTGT 
AATTTAGAAG ACGTACAAAA CCTCAGTGAC GAACAGCGTT ATTATTGCTG TGCTTGGGGA 
GGGGAAAAAA CCCGCGCCAC TATTCCAGGG GGATGTTATG GTGTTCCGAA TAAATTGGGA 
CGTTAG

Protein sequence

MTTPETPDTL PQQNGQKATP SLPEKIESLY PSGLPFSKTL LPPPNSEPQP LYLRDVKSFN 
PWLLLSSAVI MIVGLEFNFP WLGFSAALLS LFLSLQVILP SLRGWVIRYL TPQERQTLLG 
FLVFIAAIAG LAYYFGFYDR LRIWLNQFKY DEFGSWAEWV GALGQIMIAL LAVYIAWAQY 
VISKDLTLQQ NLITQQQTID TYFQGISDLV LDGEGMLEDW PQERSIAEGR TAAIFSSVDE 
TGKAKILRFL SQSRLLTPLM RDSRLGRPIL DGAGGYAEDR PSGVRVINLG VMLAGAKLSG 
QDLRWTDLSE ANMVRADLSH CDLVKANLSR TVLYDGNLKG ADLKGTRLFY GSVETASPRS 
RSAPPDYETG AYTGVVLENC NLEDVQNLSD EQRYYCCAWG GEKTRATIPG GCYGVPNKLG 
R