Gene PCC8801_1842 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_1842
Symbol
ID	7101773
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	1936063
End bp	1937985
Gene Length	1923 bp
Protein Length	640 aa
Translation table	11
GC content	44%
IMG OID	643474908
Product	ATP-dependent metalloprotease FtsH
Protein accession	YP_002372041
Protein GI	218246670
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0465] ATP-dependent Zn proteases
TIGRFAM ID	[TIGR01241] ATP-dependent metalloprotease FtsH

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAACA AGATCTCCCA CAGTCAATCT ATTCATCAAG CAAATCGCCG TCAACCCACT 
TCACGAAAAT GGGGACATCT GGTGACTAGT TGGATGCTCA TACAATCGTT ACTTGTGGCT 
ACTCCCAGTT GGGGACAAAC CCTAATTCCT TCTGGGAAAG AATCTAAACC CGAAGGTATC 
AGCTATAGTC AGTTATTGAA GCAAATTGAA TCAGGAAAAG TCCGTAAAGT AGAAATTGAC 
CCAAAATTAC AAAAAGCCAA AGTTACCCTA AAAAATCAAT CTGAACAAGA CCCCCCACAA 
GAAGTCCCCC TCTTTAAAAG CAACCTCAAC AACGAATTAA TTGCTAAGCT GCGAGATAAC 
AATGTCCCTG TGGATATTCA ACCTTCCGTA GATAATTCCG CCGCGATTAG CCTAGTTGTT 
AATTTAATCG TCCTTTTTCT GCTGTTTAGT ATTTTTATTG CCATTATTAG ACGTTCGGCC 
AATGCTTCCG GTCAAGCCAT GAATTTTGGT AAATCTCGCG CTAGGTTTCA GATGGAAGCC 
AAAACAGGGA TCAGCTTTGA AGATGTCGCT GGTATTGATG AAGCTAAAGA AGAACTGCAA 
GAAGTCGTTA CTTTTCTGAA ACAACCTGAA AAATTCACCG CTATTGGCGC AAAAATCCCC 
AAAGGCGTAT TATTAGTCGG TCCCCCTGGA ACGGGTAAAA CTCTACTCGC TAAAGCCATT 
GCAGGAGAAG CGGGGGTTCC TTTCTTTAGT ATTTCCGGTT CCGAATTTGT GGAAATGTTC 
GTTGGGGTTG GGGCTTCGCG GGTGAGAGAT TTGTTCAAAA AAGCCAAAGA AAACGCCCCT 
TGTTTGATTT TTATCGATGA AATTGATGCC GTTGGTCGTC AACGGGGAGT CGGTTATGGG 
GGAGGCAATG ATGAACGGGA GCAGACCTTA AACCAATTAT TGACGGAAAT GGATGGGTTT 
GAAGGAAATC GCGGAATTAT TGTTATTGCT GCCACTAACC GTCCTGATGT CCTTGATAAA 
GCCTTATTGC GCCCTGGACG CTTTGATCGG CAGGTAGTGG TCGATTATCC CGATCTTAAG 
GGTCGTCAGG GCATTTTAGA AGTTCACGCC CGCAATAAAA AAGTTGATCA AGAAGTCTCT 
TTAGAAGCGA TCGCTCGTCG GACACCAGGC TTTACGGGGG CAGATTTAGC CAATGTCCTC 
AATGAAGCAG CCATTTTTAC CGCCAGACGG CGCAAAGAAG CCATTACCAT GACCGAGATT 
AACGATGCGA TTGATCGCGT TGTGGCCGGG ATGGAAGGAA CGCCCCTTGT GGACAGCAAG 
AGTAAACGGT TAATTGCCTA TCATGAAATT GGCCACGCAG TGGTGGGGAG TTTGCATGAG 
GGCCACGATG CCGTCGAGAA AGTGACCCTG ATTCCTCGCG GACAAGCAAA GGGGTTAACC 
TGGTTTATGC CCGATGAAGA ATATGGGTTA GTGACGCGAA ATCAATTATT AGCGAGAATT 
GCCGGATTAT TAGGTGGAAG GGCAGCCGAA GAGGTGATTT TTGGCGAAGA TGAAGTCACA 
ACGGGGGCAG GGAATGATAT CGAAAAAGTG ACCTATTTAG CGAGGCAGAT GGTAACGCGC 
TTTGGGATGT CAGAATTGGG GTTAGTTGCC CTAGAGAGTG ATAATGATGA TAGTTATGTG 
GGGCTTGATG GTAGTCGGCG ATCGGATTAT TCAGACGAGA TTGCCACTAA AATTGATCAT 
CAGGTGCGTT CTATTGTTGA TGATTGTCAC AATTACGCTC AAAAAATTAT CCAAGAAAAT 
CGCATTGCTA TTGATCGCTT AGTGGATATT TTAATTGAAC AAGAAACCAT TGAAGGAGAA 
CAATTTCGTC AACTGCTAGA AGAATTTCGC CTAAAGGTTG ATAAAACCTT ATTAAAGGTT 
TAG

Protein sequence

MSNKISHSQS IHQANRRQPT SRKWGHLVTS WMLIQSLLVA TPSWGQTLIP SGKESKPEGI 
SYSQLLKQIE SGKVRKVEID PKLQKAKVTL KNQSEQDPPQ EVPLFKSNLN NELIAKLRDN 
NVPVDIQPSV DNSAAISLVV NLIVLFLLFS IFIAIIRRSA NASGQAMNFG KSRARFQMEA 
KTGISFEDVA GIDEAKEELQ EVVTFLKQPE KFTAIGAKIP KGVLLVGPPG TGKTLLAKAI 
AGEAGVPFFS ISGSEFVEMF VGVGASRVRD LFKKAKENAP CLIFIDEIDA VGRQRGVGYG 
GGNDEREQTL NQLLTEMDGF EGNRGIIVIA ATNRPDVLDK ALLRPGRFDR QVVVDYPDLK 
GRQGILEVHA RNKKVDQEVS LEAIARRTPG FTGADLANVL NEAAIFTARR RKEAITMTEI 
NDAIDRVVAG MEGTPLVDSK SKRLIAYHEI GHAVVGSLHE GHDAVEKVTL IPRGQAKGLT 
WFMPDEEYGL VTRNQLLARI AGLLGGRAAE EVIFGEDEVT TGAGNDIEKV TYLARQMVTR 
FGMSELGLVA LESDNDDSYV GLDGSRRSDY SDEIATKIDH QVRSIVDDCH NYAQKIIQEN 
RIAIDRLVDI LIEQETIEGE QFRQLLEEFR LKVDKTLLKV