Gene GM21_3569 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3569
Symbol
ID	8138942
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	4148848
End bp	4150194
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	64%
IMG OID	644871189
Product	Peptidase M23
Protein accession	YP_003023348
Protein GI	253702159
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0739] Membrane proteins related to metalloendopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	129
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAACCT CGGCAATCCT CGGGTTATTT GTCTTGTTTG TCGCAATCGC GGCAGGGATC 
GGGATCTATT ACTTCGTCGA CACCTCCGGG CCGGCCCTGG CGCTTTCCCG TCGCCCGGGT 
CCTATAGCCT CCAGGGCAGA CCTGATCCTG ACCCTGCGGG ACCGGGCTTC AGGCCTCAAG 
TCCCTCAGCG TGCAGGCGGT GCAGGGAGAA AAGAGCTTCG GCATCCTGAC CAGGGAATAC 
ACCGCAGGGA CCACCGACGC GAAGGAGACC TTCCGGCTCC CGCCCCCCCC CGGACTGAAA 
GAGGGCCCGG TGACGCTGCG GATATCGGCT GCCGACCGCT CCGTGTTCAG GTTCGGCTCG 
GGCAACAGCA CCTCCGTCGC GCTGGAGTTC GTGGTGCAGA ACAAGCCCCC TGTGGTCTCC 
GTGCTCAGCA CCGCGCACAA CGTCTCGCCG GGAGGCTCCG CCCTGGCGGC CTACACGCTG 
AACCGGGACG CGGTCAAGAC CGGCGTCACC TTCGCGGACA GGTTCTATCC AGGCTATAAG 
CAGCCCGAGG GTTACTACGC CTCCCTGTTC CCGTTCCCCT ACGACGTCCC CCCGGAGCGT 
TTCATCCCCA AGGTCTTCGC GGTGGACCAG GCGGGCAACG AGCGGTTTAC CGGGATCTAC 
TACCGGGTCC TGGCCAAATC CTTCCCCAAG GACCGCATCG AGCTGACCGA CGCCTTCCTG 
GAGAAGGTCT TCACCGAATT CAAGGACCGC TACCCCCAGA TAACGAACCC GCTCGAGCTG 
TACCTGAAGG TGAACCGGGA GGTGCGGCAA AGCGACGCGA AGATCCTGCA GCAGTGCAGC 
CTGAAAACCT CCCCCACCCC TCTTTGGGAG GGGGACTTCA TGCGCCTCCC CAACTCCGCC 
CCGCGCGGTA CCTTCAACCA GTTGCGCAGC TACTATTACC AGGGGAAAGA GGTGGACCAG 
CAGCATCACC TGGGAATCGA CCTGGCCTCG CTCTCCCACG CCAAGGTCCC CGCGGCCAAC 
CGAGGCAAGG TGGTATATGC CGACGACCTG GGGATCTACG GCCAGTGCAT CATCATTGAC 
CACGGGATGG GGCTGCAGAG CCTGTACGGC CACCTGAGCC GGATCGGCGT GAAGGAAGGG 
GACGAGGTGA AAAAAGGGGA CACCATCGGC GACACCGGGG ACACCGGGCT TGCCGGCGGG 
GACCATCTGC ATTTCGGCGT GGTGGTGTCG GGCCAGGAGG TGAACCCGAT CGAATGGTGG 
GACCCGTCCT GGATCAAGAA CAACGTCACG GACAAGTTGA AGGAAGCAAG GGACGCCGCG 
GCTGCCGCCG CCGGGACCGC GAAGTAG

Protein sequence

MRTSAILGLF VLFVAIAAGI GIYYFVDTSG PALALSRRPG PIASRADLIL TLRDRASGLK 
SLSVQAVQGE KSFGILTREY TAGTTDAKET FRLPPPPGLK EGPVTLRISA ADRSVFRFGS 
GNSTSVALEF VVQNKPPVVS VLSTAHNVSP GGSALAAYTL NRDAVKTGVT FADRFYPGYK 
QPEGYYASLF PFPYDVPPER FIPKVFAVDQ AGNERFTGIY YRVLAKSFPK DRIELTDAFL 
EKVFTEFKDR YPQITNPLEL YLKVNREVRQ SDAKILQQCS LKTSPTPLWE GDFMRLPNSA 
PRGTFNQLRS YYYQGKEVDQ QHHLGIDLAS LSHAKVPAAN RGKVVYADDL GIYGQCIIID 
HGMGLQSLYG HLSRIGVKEG DEVKKGDTIG DTGDTGLAGG DHLHFGVVVS GQEVNPIEWW 
DPSWIKNNVT DKLKEARDAA AAAAGTAK