Gene GM21_4109 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_4109
Symbol
ID	8139483
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	4692479
End bp	4693570
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	70%
IMG OID	644871724
Product	peptidase M24
Protein accession	YP_003023882
Protein GI	253702693
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	102
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGGCA CCGCGCGCGC GGAGGAGATG GCCGGGAAGA TCCGCCTGGT CCGGGAATTG 
CTCGGCGAGG GAAGGGTGCT GAGGCTCAAG GGGATCGACT GGTTCTCCTG GATCACGGCC 
GGGGGCTCCA ACGAGGTGCT CTTGGCGGCC GAGACCGGGA TCGCCGAGTT CGTGGTGACC 
GGGCGCGGCG CTTTCGTGGT GACCAACGAG ATCGAGGCGC AGCGCCTGAT CGACGAAGAG 
CTCCCCCCCG GCTGCGAGCT GCGCATCCTC CCCTGGGCCT ACCCTTCCCA GTTGGAGGTG 
GTGATGAGGG AGCTGGCCGA AGGGACGCCG GTCTACTCCG ACCGCCCGGC CGAGGCGGAG 
CGGGAGCTCC CGCTGCCGCT TCTGGCGGCC AAGCGCACCC TCTGTCCTGC CGAGCTGCAC 
CGCTACCGCG AGGTGGGGCT TCTGGCCTCG CAGGCGATGA CCGAGACCCT GCAGCAGGCG 
AACCCCGACT GGAGCGAGTA CCGCCTTGCC GCGGCAGGCG CCTGCGCCCT CCTCTCGCGC 
GGGCTCGCCC CCTGCCTGAT CATGGCTGCC GGGGACAGGC GCCGCCGGCT GTACCGCCAT 
CCGATCACCA ACAGGGACCC GCTGGGCGCC TCCGCGATGC TGGTCTTCTG CGCCCGGGGG 
TACGGCCTCT ACGCCAACCT CACCAGGTTC GTCGCCTTCG GGCCCCTATC CGACGAAGAG 
GAGCAAAAGC ACGCGCAGGT GCGCGAGATC GAGGCCCACG CGCTGCTCCT CTCCCGCCCG 
GGGGTCCTTT TGCACGAGGT CTACCGCGAG CTTGCCTCGG CCTACGCCGC CGCGGGTTAC 
GAGCACGCGG TCAAGGAGCA CCACCAGGGC GGGATCACCG GCTACCTTTC CCGGGAGGCG 
ATAGCGAATC CCGAGGCGCG GGAGCACCTG AGCGCCGGGA TGGCCGTCGC CTGGAACCCC 
AGCCTCCCCG GCGCGAAAAT AGAGGATACC TTTCTGGTGA CAGAGACCGG AGTCGAAAAC 
CTGACGCTCG ACCCGGCCTG GCCGACGGTG CAGGCGGCCG GTCTGGAACG GCCGCTCGTC 
CTCAGACGAT AG

Protein sequence

MNGTARAEEM AGKIRLVREL LGEGRVLRLK GIDWFSWITA GGSNEVLLAA ETGIAEFVVT 
GRGAFVVTNE IEAQRLIDEE LPPGCELRIL PWAYPSQLEV VMRELAEGTP VYSDRPAEAE 
RELPLPLLAA KRTLCPAELH RYREVGLLAS QAMTETLQQA NPDWSEYRLA AAGACALLSR 
GLAPCLIMAA GDRRRRLYRH PITNRDPLGA SAMLVFCARG YGLYANLTRF VAFGPLSDEE 
EQKHAQVREI EAHALLLSRP GVLLHEVYRE LASAYAAAGY EHAVKEHHQG GITGYLSREA 
IANPEAREHL SAGMAVAWNP SLPGAKIEDT FLVTETGVEN LTLDPAWPTV QAAGLERPLV 
LRR