Gene PCC8801_2505 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_2505
Symbol
ID	7101690
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	2596539
End bp	2597654
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	42%
IMG OID	643475547
Product	pentapeptide repeat protein
Protein accession	YP_002372669
Protein GI	218247298
COG category	[S] Function unknown
COG ID	[COG1357] Uncharacterized low-complexity proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAGACT ATTCGCCTGT TCTTCATCTT GTCACCTTCC ATAACCCCTA TCCTAACTGT 
GTTTCCCTCA AATTAGACAC CATGGGGAGT CAATCCTCAT CGGGCCAGAT AATGCTTCAG 
TTACAGGGAC ACTTCAACGA ACAGGAAAAA GACCTCCTCA ATGGTCATCT GAAATTCGGT 
TTAAAGGGGG GTATACTATC ACTTGAACTG GAAAATGGAG AAATAATCTA TCCTGAACCC 
TTACTAGAAG ATTGGGCACA ACTTCAAACC CAGTCGTCTG TCAATCCAAG TTGGGAATTA 
ACCCCAAAAA CTGGGGCATC TATCCTAAAA ATCGATAATA TTACTGTTCC TTTCGCCATT 
ATTCAACCTC AAACTGAGCC ATTATATCTA ACAGTCACCT TAAAAGTCAC TCCTCAAAAC 
CTTTCTATTA CCAATGCAGA AGGGTTATGG CGGCACGATA TTCACCCCAA CCAACACGCG 
ATATTAGAAC GGGTATTAGC CCAATTTTTG TATAAAAATC GCTTATCTTC CCATTTGTGC 
CGTTTAGTTT TTAGCTCTAA TAAGGGGACT CATCAGGCAA CCCTAGAAGA CTATCCTAGC 
CAAGAACTTG ACTCCCATGA ATTAGCTCAA CTGCATCAAC GCATTGAACA GCTTTACGCT 
GCCAATACCC ATAATTTAGC TGAATTGATC AAATTAGCGC ATTTTAACCC TTTAACAGAC 
CTAGCAGGAG GCAATTTTTT AGCGGCTGAA TTAAGCGCAG TGGAGTTAAG TGGAGCGAAT 
CTGACTCAAA CCAATTTTCG AGGAGCGAAT TTGACCGATG CAGAGTTAAG CGAGGCTATC 
CTAAACTATT GTAAATTCAG TGGAGCCGAC TTAAGTGGGG CTTATTTAGG CAATGCTCAA 
TTAGTGAAAG CGGATTTTCA TCGCGCGAGT TTAGCCGTTG CTAACCTCAT TGGGGCGAAT 
CTAACGGAAG CTAACTTAAG GGAAGCTAAC TTAATTGACA CTAATTTAAG CGGAGCAACC 
GTTAAAAACG CAAAATTCGG CGAAAATCCA GGCATGACCC CAGAATTAGA GCAGAGTTTA 
CGCGAACGCG GTGCAATTTT TGTCCATAAT CCTTAA

Protein sequence

MSDYSPVLHL VTFHNPYPNC VSLKLDTMGS QSSSGQIMLQ LQGHFNEQEK DLLNGHLKFG 
LKGGILSLEL ENGEIIYPEP LLEDWAQLQT QSSVNPSWEL TPKTGASILK IDNITVPFAI 
IQPQTEPLYL TVTLKVTPQN LSITNAEGLW RHDIHPNQHA ILERVLAQFL YKNRLSSHLC 
RLVFSSNKGT HQATLEDYPS QELDSHELAQ LHQRIEQLYA ANTHNLAELI KLAHFNPLTD 
LAGGNFLAAE LSAVELSGAN LTQTNFRGAN LTDAELSEAI LNYCKFSGAD LSGAYLGNAQ 
LVKADFHRAS LAVANLIGAN LTEANLREAN LIDTNLSGAT VKNAKFGENP GMTPELEQSL 
RERGAIFVHN P