Gene GM21_1916 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_1916
Symbol
ID	8137250
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	2223132
End bp	2224928
Gene Length	1797 bp
Protein Length	598 aa
Translation table	11
GC content	63%
IMG OID	644869530
Product	ATP-dependent metalloprotease FtsH
Protein accession	YP_003021727
Protein GI	253700538
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0465] ATP-dependent Zn proteases
TIGRFAM ID	[TIGR01241] ATP-dependent metalloprotease FtsH

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	83
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAGCA CGAGCAAGAA GAAGTTACTG ATAATAGTTG CCGCTTTGAG CATTGTGGCG 
GGAAGCTGCT ACGGTATCTA CGCCTGGAAG AACTCTCATT CGGATGAGGG TAAACAGATC 
AGCTACACGG CTTTCATGGA GAAGGTCAAT GCCGGCGGCA TAGCGAAGGT GAAGATCGCC 
GGCGACCAGA TCGACGCTGT TGGAAAATCC GGCGAGAAAT TTCGGTTATT TCTTCCTGCG 
GGAGCCGAAC TGGCCGACGC CCTGGTAGCC AAGAAGATTG ACTTCTCCTC GAATCCCGCC 
GCGTCCGAGC CCAAATGGTT CGAGATCAGC ATCATACTCC TGGTCGCGCT ATTTCTCGTC 
ATGGTGCTCA AGAGATACGG CGGAGTGGGG CGGAGCAAGG CGAGGATCAT CGACTGCTCG 
GAGTCTCTCA CCCGGTTTAA CGATGTAGCG GGCGCCGAGG AGGCAAAGGC CGAGCTTCTC 
GATACGGTCG AGTTCCTGAA AGACCCCGCG AAATTCAGCG CCCTGGGCGG CAAGATGCCG 
ACCGGCGTGC TTTTGGTGGG CCCTCCCGGC ACCGGCAAGA CGCTCCTCGC CAGGGCTGTA 
GCCGGCGAGG CCGACGTTCC CTTCTTCTCC ATATCGGGCT CCGAGTTCGT CGAGATGTAC 
GTCGGCGTCG GCGCTTCCAG GGTGAGGGAC CTTTTCGCGC AGGCAAAAAA GGCGGCTCCC 
TGCATCGTCT TCATCGACGA GATCGACGCG GTCGGCCGCA AGCGCGATGC CGCGGTGGGG 
GGCGGCGCCA GCGACGAGCG CGACCAGACC CTGAACCAGC TCCTGGTGGA GATGGACGGC 
TTCGCCGTCA ACTCCGGCAT AGTGGTTCTC GCCGCGACCA ACCGTCCCGA GATACTCGAC 
GCTGCGCTGC TTCGCTCCGG CCGCTTCGAC CGCGAGGTCA CCGTGGGCGC GCCCGATATA 
AGGGGACGCG AGGCGATACT GAAGGTCCAC TCGAAGAACG TACCCCTGAG CCCGGAGGTC 
GACCTGATGG TGATCGCCCG CGGGACGCCG GGCATGTCCG GCGCCGATCT GGCCAACGTG 
GTCAACGAGG CCGCTATCCT GGCGGCAAGG TCAAACAAGG GGTGTGTCGA GATGCTCGAC 
TTCGACAACG CGAAGGACAA GGTGCTGATG GGGGCCGAGA AGAAGTCGAT GGTGCTCTCC 
GACAAGTCCA AGCTCTCGAC CGCCTACCAC GAGGCGGGGC ACGTGCTGGT GGCGAAGCTG 
GTGCCGGGAT GCGACCCGGT GCACAAGGTC TCCATCATCC CTCGCGGCAG GGCCATGGGG 
GTCACGCTGC AGATCCCCGA GGAGGACATC TACTGCTACA CCAAAGAGAT GCTGCTGGCC 
CACCTCAAGG TGCTCATGGG CGGGCGCGCC GCCGAGGAGA TCATCTTCCA CACCACGACC 
ACCGGTGCCG GCAACGACCT GGCGCGCGCC ACCGATACGG CCAGGAAGAT GGTGAGCGAG 
TGGGGCATGT CCAGGGCCTT CGGTCCGGTC GCTTTCGGCC ATCAGGAGAA CACCGACGGC 
GGCGGCAAGA AAGGGTTCAG CGACGCTACC GCGCTGGAGA TGGACAACGA GATCAGGTCC 
ATCGTCACCA CCTGCTATGC CGACGTGCGG ACGCTCCTGG AGGAGAACCT GGACGTCCTT 
GAGCGGCTCA CCCAGGAACT GGTCGTCAAG GAGACGCTGG ACGCCGCCGA GATCGACGCC 
ATCCTGGGCC TCGCCACGGC GGACGACGCC GAAGCATCCT GCTGCGCCGC CGCATGA

Protein sequence

MTSTSKKKLL IIVAALSIVA GSCYGIYAWK NSHSDEGKQI SYTAFMEKVN AGGIAKVKIA 
GDQIDAVGKS GEKFRLFLPA GAELADALVA KKIDFSSNPA ASEPKWFEIS IILLVALFLV 
MVLKRYGGVG RSKARIIDCS ESLTRFNDVA GAEEAKAELL DTVEFLKDPA KFSALGGKMP 
TGVLLVGPPG TGKTLLARAV AGEADVPFFS ISGSEFVEMY VGVGASRVRD LFAQAKKAAP 
CIVFIDEIDA VGRKRDAAVG GGASDERDQT LNQLLVEMDG FAVNSGIVVL AATNRPEILD 
AALLRSGRFD REVTVGAPDI RGREAILKVH SKNVPLSPEV DLMVIARGTP GMSGADLANV 
VNEAAILAAR SNKGCVEMLD FDNAKDKVLM GAEKKSMVLS DKSKLSTAYH EAGHVLVAKL 
VPGCDPVHKV SIIPRGRAMG VTLQIPEEDI YCYTKEMLLA HLKVLMGGRA AEEIIFHTTT 
TGAGNDLARA TDTARKMVSE WGMSRAFGPV AFGHQENTDG GGKKGFSDAT ALEMDNEIRS 
IVTTCYADVR TLLEENLDVL ERLTQELVVK ETLDAAEIDA ILGLATADDA EASCCAAA