Gene GM21_1377 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_1377
Symbol
ID	8136705
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	1624803
End bp	1625969
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	61%
IMG OID	644868991
Product	peptidase M24
Protein accession	YP_003021194
Protein GI	253700005
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	67
Fosmid unclonability p-value	0.209377
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGAACA GGCAGGAATC GCAACTAAGA ATCGCCAGGC TGCAACAGGA ACTTAAGGCA 
AAGGGTATCG ACGGGGCGCT CTTCATCTAC CCCATCGACG TCTACTATTT CACCGGCACC 
CGCCAGAATT CGACGCTCTG GGTCCCCGCC GAGGGCAAAC CGCGCCTGAT GGTGCGCAAA 
AGCGTCTCCA GGGCGGTCAA GGAAAGCTTA ATCGAGGAGA CCGTCCCCTT TCCGTCCAGC 
AAGGAGTTCC CGGCGCTGTT CCCGCCCGAG ATGCAGAAGA TAGGGTTCAC CTTCGACGTG 
GCGCCGGTGC AGCAGTACAA CTACTACGCG AAGCTTTTGC CGGGACGCGA GTTTGTCGAC 
GTCTCCGCCA TCAACCGCGA AATCCGCTCG GTGAAGTCGG AGTGGGAACT GGGGCAGATG 
CGGCAAAGCG GCGACATGAT CTGCCAGGTC TTCAGGGAGG TTCCGGGATT CCTGAAGGAA 
GGGATGCGCG AGGTGGACCT GGCGGCAGAG TTCGAATGCC GGCTGAGAAA GGCCGGGAGC 
GAAGGTTACG TGCGCATGCG CGCCTTCAAT CAGGAGCTGT TCCAAGGGCT CGCGGTTTCA 
TCCGCGGCCT GCGACCCCGG CTTCTTCGAC GGCGCCGTGA CCGGGCAGGG GATGTCCAGT 
GCCTCCCCGC ATGGCGCATC CGCCGCGGTA ATCAAAGCCA ATACCCCTAT CCTCGTCGAC 
TATACCGGCA TCTTCAACGG CTACATCGTT GACATAACTC GCTTTTTCGT CATCGGCAAG 
CTGGCGCCCG AGTTGGAGCA CGGCTTCGCC ACGGCGCTCG CCATCCAGAA ATACCTGGTC 
GACAACCTGA AGCCGGGGGT GGTCTGCGAG GAGTTGTTCC TGAAGGCGGC CGAGATGGCG 
GAAGCCGCGG GCTTGGCCCG GAACTTCATG GGGGCCCCCG GAGAGAACGC CAAGTTCGTG 
GGGCACGGGG TCGGGTTAGA GCTGGACGAG TTCCCGGTAC TGGCGCAAGG GTTCAAGGTG 
CCGCTGCAGG AAGGGCAGAC CATTGCCATC GAACCGAAAT TCGTCTTCCC GGGCCAGGGT 
GTGGTCGGGA TAGAGAACAC CTTTGCTGTC GGCAAAAACG GCGGCGTGAA ACTGACCGAC 
ATGCCGGACG AGGTCGTGTA CCTGTAA

Protein sequence

MLNRQESQLR IARLQQELKA KGIDGALFIY PIDVYYFTGT RQNSTLWVPA EGKPRLMVRK 
SVSRAVKESL IEETVPFPSS KEFPALFPPE MQKIGFTFDV APVQQYNYYA KLLPGREFVD 
VSAINREIRS VKSEWELGQM RQSGDMICQV FREVPGFLKE GMREVDLAAE FECRLRKAGS 
EGYVRMRAFN QELFQGLAVS SAACDPGFFD GAVTGQGMSS ASPHGASAAV IKANTPILVD 
YTGIFNGYIV DITRFFVIGK LAPELEHGFA TALAIQKYLV DNLKPGVVCE ELFLKAAEMA 
EAAGLARNFM GAPGENAKFV GHGVGLELDE FPVLAQGFKV PLQEGQTIAI EPKFVFPGQG 
VVGIENTFAV GKNGGVKLTD MPDEVVYL