Gene PCC8801_3403 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_3403
Symbol
ID	7103103
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	3548238
End bp	3549284
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	45%
IMG OID	643476418
Product	putative DNA-binding/iron metalloprotein/AP endonuclease
Protein accession	YP_002373527
Protein GI	218248156
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0533] Metal-dependent proteases with possible chaperone activity
TIGRFAM ID	[TIGR00329] metallohydrolase, glycoprotease/Kae1 family

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAACAG TATTGGCAAT TGAAACAAGT TGTGACGAAA CCGCCGTCGC AATTGTAAAT 
AATCGTAACG TTTGTAGTAG TGTAGTGGCT TCCCAAATCG CCCTCCATAA GACCTATGGC 
GGTGTGGTTC CTGAGATGGC TTCCCGTGAA CATTTAATCA CCATTAATGC TTGTTTGGAA 
GAAGCCTTAG CTCAATCTAA TCTCAGTTGG TCGGATATTG ATGGGGTTGC CGCTACCATG 
GCCCCTGGTT TAGTAGGTGC TTTAATGGTG GGGGCAACCA CCGCTAAAAC CCTGGCCATT 
GTTCATCAAA AGCCCTTTGT TGGGGTGCAT CACCTCGAAG GTCATATCTA TGCCACTTAT 
TTGAGCGATC CTACCTGGGA ACCCCCGTTT TTATGTCTTT TGGTGTCAGG GGGTCATACT 
AGCCTAATTT GGGTCAAAGA TTGCGGGTTC TATGAACAAT TGGGGGCTAC TCGTGATGAT 
GCGGCCGGGG AGGCCTTCGA TAAGGTAGCA CGGTTACTCA ATTTGGGCTA TCCAGGGGGA 
CCAGTGATCG ATCGCTTGGC TAAAACAGGC AACCCGCAAG CCTTTGCTTT ACCAGAGGGA 
CGAGTTTCTT TACCCGAAGG GGGTTATCAT CCCTATGATT CCAGTTTTAG TGGCTTAAAA 
ACCGCCGTAT TACGGTTAGT TCAAACCCTA GAAAAAGACG ATAAAAATAG TTTGCCTGTG 
GCAGATTTGG CGGCCAGTTT TCAATCAACT GTAGCGCGAT CACTGACTAA AAAAAGTATC 
GCTTGTGCTT TGGATTATGG CATTAATTCT ATTGCTGTTG GTGGTGGAGT TGCCGCCAAT 
AGTGAACTGA GAAAACAATT ACAAGAAGCG GGAATTAACC ACAATATCAA AGTGCATTTT 
CCCCCTTTAA AATGGTGTAC TGATAATGCA GCAATGATCG GTTGTGCTGC TGCGGATCAT 
CTCAATAGAG GTCATACTTC TTCTTTGAGT TTGAATGTTA ATTCTCGATT ATCTATTACC 
GATGTGATGC AGCTTTATGA ATTTTAA

Protein sequence

MATVLAIETS CDETAVAIVN NRNVCSSVVA SQIALHKTYG GVVPEMASRE HLITINACLE 
EALAQSNLSW SDIDGVAATM APGLVGALMV GATTAKTLAI VHQKPFVGVH HLEGHIYATY 
LSDPTWEPPF LCLLVSGGHT SLIWVKDCGF YEQLGATRDD AAGEAFDKVA RLLNLGYPGG 
PVIDRLAKTG NPQAFALPEG RVSLPEGGYH PYDSSFSGLK TAVLRLVQTL EKDDKNSLPV 
ADLAASFQST VARSLTKKSI ACALDYGINS IAVGGGVAAN SELRKQLQEA GINHNIKVHF 
PPLKWCTDNA AMIGCAAADH LNRGHTSSLS LNVNSRLSIT DVMQLYEF