Gene PCC8801_4122 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_4122
Symbol
ID	7101909
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	4322321
End bp	4323664
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	38%
IMG OID	643477111
Product	putative Zn-dependent protease
Protein accession	YP_002374210
Protein GI	218248839
COG category	[R] General function prediction only
COG ID	[COG0312] Predicted Zn-dependent proteases and their inactivated homologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATTTAG ATCGCTTAGA ACAGTTAGAA GTAACGTTTA ATCAATTGTC TGAATTTCTG 
ATTGATCAAT TAAATAATGC GGAGCATCTT TCTCTAGAAT TAAGTAGTGA ACAAACCCAA 
TTTATCCGCT TTAATAATGC AAAAGTTCGT CAAACAGGAT TGGTTACTGA TGGTAATATT 
AAATTGAGTT TTATTGCTAA TCAACGCACT GTTTTTATGA TGTTTCCCTT CACGGGAGAT 
CTGACGACAG ATCAACAAAA TGGTCTAGAA AGTCTTAATT ATTTACGTCA AGACATTCTC 
CAAGTTCCTG AAGATCCCCA TCTTGTATTA CCTGAAAATA AGGGAACTAC AAGAGAAGTT 
TATCGAGGGG ATTTATTAGT TCCAGAAATA GCGGTTAAAA CCCTTCTCCC TGAAGTACAA 
AACTTGGATA TGACAGGAAT TTATACCGCA GGACAAGTCA TCCGAGGTAA CGCTAATTCA 
GAGGGACAAA ATCATTGGTT TGCTACGGAT TCTTTTTGTT TAGACTATTC TTTAATTGCC 
CCTTCAGAAA AAGCAGTCAA AGGGATTTTA TCGGGAAGAA ACTGGGATGA ACAGCAATAT 
CAAACTCAAA TAAAATCGTC TCAAAATCAA CTTTTAGCCC TCAATAAATC TCCAAAACAA 
ATACAACCTG GGGGCTATCG TACCTATTTT GCACCTGCGG CCACGGCTGA TCTCTTAGGG 
ATGCTATCTT GGGGTGCAAT TAGTGAAGCG TCTCTGCGGC AGGGAGGAAG TGCTTTGATG 
AAGTTAAAAG AAGGTAAGAC CCTATCTCCT AAGCTTAATT TACAGGAGAA TTTTAGTCTG 
GGAAGCGTGC CTAAATTCAA CGAATTGGGT GAAATTTCTC CTGATATTTT GCCTTTAATT 
ACTGAAGGAA ACCTAATCAA TACTTTGGTT AATTCTCGGA CAGCTACTGA ATATAAAATT 
ACCGCTAATG GAGCCAATTC TTCTGAATCT TTGAGATCCC CTGAATTGGG TAAAGGAACC 
TTATCCAGTG AGGATATTTT CAACACATTA GGCACGGGGT TATATCTATC TAATTTACAC 
TATTTAAACT GGAGCGATCG CACGGGGGGA AGAATTACGG GAATGACCCG TTATGCCTGT 
TTTTGGGTAG AAAATGGCGA AATTGTGGCT CCTATTAAAG ACCTCAGATT TGATGACAGT 
CTCTATCGTT TTTGGGGAGA AAATCTTGAA GCATTAACGG ACTTTCAAGA ATTTATTCCT 
GAAACCAATA CCTATGAAAG ACGCGAAATA GGAGGCAGTT TAGTCCCTGG AATGTTAGTT 
AATGATTTTC AATTTACTTT GTAG

Protein sequence

MNLDRLEQLE VTFNQLSEFL IDQLNNAEHL SLELSSEQTQ FIRFNNAKVR QTGLVTDGNI 
KLSFIANQRT VFMMFPFTGD LTTDQQNGLE SLNYLRQDIL QVPEDPHLVL PENKGTTREV 
YRGDLLVPEI AVKTLLPEVQ NLDMTGIYTA GQVIRGNANS EGQNHWFATD SFCLDYSLIA 
PSEKAVKGIL SGRNWDEQQY QTQIKSSQNQ LLALNKSPKQ IQPGGYRTYF APAATADLLG 
MLSWGAISEA SLRQGGSALM KLKEGKTLSP KLNLQENFSL GSVPKFNELG EISPDILPLI 
TEGNLINTLV NSRTATEYKI TANGANSSES LRSPELGKGT LSSEDIFNTL GTGLYLSNLH 
YLNWSDRTGG RITGMTRYAC FWVENGEIVA PIKDLRFDDS LYRFWGENLE ALTDFQEFIP 
ETNTYERREI GGSLVPGMLV NDFQFTL