Gene PCC8801_0920 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_0920
Symbol
ID	7102013
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	971272
End bp	972396
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	39%
IMG OID	643474013
Product	peptidase M50
Protein accession	YP_002371153
Protein GI	218245782
COG category	[R] General function prediction only
COG ID	[COG1994] Zn-dependent proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAACA ATATAAGGGT TGGCAATTTA TTCGGGATTC CTTTTTATGT AAATCCTTCT 
TGGTTCCTAG TATTAGGGTT AGTTACCTTA AGCTATGGAG GACAGTTAGC CTTGTTCCCC 
CAATTAGGAG GAATTACTCC CTGGATTCTG GGTTTTGTTG CTGCATTACT CTTATTTTCT 
TCAGTCGTTG CCCATGAATT GGGACATAGT TTTGTAGCGA TGTCCCAAGG GATTGAAGTT 
AAATCGATTA GCCTCTTTTT GTTTGGGGGA TTAGCCAATT TAGAAAGAGA ATCTGAGACA 
CCTTTTGAAG CCTTTTTAGT GGCGATCGCA GGTCCTGCGG TTAGTTTAAT TCTCTTTCTT 
TTTTTAACCC TAATTGTTAG CAATTTTGCC TTTAGTGCCC CCATTACAGC CATCCTAGGT 
TTACTTGCCT ATATTAACTT AATTCTGGGC TTATTTAACC TAATTCCTGG GCTACCTTTG 
GACGGGGGTA ACATTCTAAA AGCCCTTGTT TGGAAGATTA CAGGTAATCC GAATAAAGGC 
ATTATTTTTG CCAGTCGAGT CGGACAACTG TTTGGTTGGA TAGCCGTTAC TATCGGTGGA 
TTAGCGATTT TAGGGATTAG TCCTATCGGC AGTTTCTGGA CTTTATTAAT TGGCTTTTTC 
TTGTTACAAA ATGCAGGATT TTCGGCTCAA TCGGCTCAAT TCCAAGAAAC CCTAAGCGGT 
TATACGGCTG AAGATGCGGT TATTCCTGAT AGTCCAGTCG TTTCTGATAG CTTAAATGTC 
AGAGAATTTG TTAACGACTA TGTAATCGGT AAGAGTGTCT GGAAAAAGTT TTTAGTGACT 
AATGAAGAAG GGAAACTATC AGGTATTCTT GAAATAGATA GTTTGAAAAA AGTGTCTACT 
TCCCAATGGA CTGAATTAAA ACTTGCTGAG ATAATGGAAC CCATTAGTCC TAATATCACT 
CTAATTCAAG CGGATCAATC TTTGTTAGAG GTGGTTAAAC TATTAGAGAA TGATCCTCGT 
CAACAATTAA CCGTCGTCAA AGATAATGGT GTCGTTCTCG GATTATTAGA GAAAGCTTCT 
GTTATCAAGT TTCTCCAACA AAAAGCACAA GCTAAAGCTA TTTAA

Protein sequence

MNNNIRVGNL FGIPFYVNPS WFLVLGLVTL SYGGQLALFP QLGGITPWIL GFVAALLLFS 
SVVAHELGHS FVAMSQGIEV KSISLFLFGG LANLERESET PFEAFLVAIA GPAVSLILFL 
FLTLIVSNFA FSAPITAILG LLAYINLILG LFNLIPGLPL DGGNILKALV WKITGNPNKG 
IIFASRVGQL FGWIAVTIGG LAILGISPIG SFWTLLIGFF LLQNAGFSAQ SAQFQETLSG 
YTAEDAVIPD SPVVSDSLNV REFVNDYVIG KSVWKKFLVT NEEGKLSGIL EIDSLKKVST 
SQWTELKLAE IMEPISPNIT LIQADQSLLE VVKLLENDPR QQLTVVKDNG VVLGLLEKAS 
VIKFLQQKAQ AKAI