Gene GM21_3803 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3803
Symbol
ID	8139177
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	4374718
End bp	4375575
Gene Length	858 bp
Protein Length	285 aa
Translation table	11
GC content	66%
IMG OID	644871422
Product	modification methylase, HemK family
Protein accession	YP_003023580
Protein GI	253702391
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG2890] Methylase of polypeptide chain release factors
TIGRFAM ID	[TIGR00536] HemK family putative methylases [TIGR03534] protein-(glutamine-N5) methyltransferase, release factor-specific

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	115
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGCCA ACGCCGAAAA ATGGGACGTA CTCAAAGTCC TGAATTGGAC CAAGGGTTAC 
CTCGCCGAAA AGGGTGTGGA GAACCCCCGC CTGGAAGCGG AGTGGATGCT CTGCGAGGCG 
CTCTCGCTGG ACCGGGTGGG GCTCTACCTC AACTTCGACA AGCCGCTCTC CGACGCCGAG 
CTCGCCCTCT ACCGCGGCAT GGTCGCCCGG CGCGGCAGGC GCGAACCGCT GCAGTACATC 
CTGGGTAGCC AGGAGTTCAT GGGGCTCGAA TTCCGGGTCA CCCCCGCCGT CCTGATCCCG 
CGCCACGACA CCGAGGTGCT GGTGACCGAG GCGGTGAAGA GGGGAGGCGC GTGCCGCAGC 
ATCCTCGACA TCGGCACCGG GAGCGGCTGC GTCGCCATCG CCGTCGCCAA GGCGCTCCCC 
GAGGCCGAAG TCTGCACCGT GGACGTTTCC GGCGAGGCAA TCGAGGTGGC CCGGGGGAAC 
GCGGAGCGAA ACGGGGTCTC CGTGCAGTTT TTCCAGGGCT CGCTGTTCGA GCCGTTTGCC 
GGGAAGCGTT TCGATATGCT AGTATCCAAC CCGCCCTACA TCACTTCGGC TGATCTAGCT 
TCCCTCCAGC AGGAGGTGCG CGACTTCGAG CCGGCGGGCG CCCTGGACGG GGGAGGCGAC 
GGGCTCGATT TCTACCGGCG CATCACGGCC GGCGCCCCGG CGCACCTCAA TCCGGGCGGC 
TGGCTCTTGT TCGAAGTGGG GGCCGGGCAG GCAGGGGAGG TGCTGGAGCT CTTGAACTCC 
GGCGGTTTCA CCAACGAAAG GTTCAGCCAG ACCGACCCCG CAGGTATTGA GCGGGTGGTA 
GGCGCAAGGC TTCAGTAA

Protein sequence

MTANAEKWDV LKVLNWTKGY LAEKGVENPR LEAEWMLCEA LSLDRVGLYL NFDKPLSDAE 
LALYRGMVAR RGRREPLQYI LGSQEFMGLE FRVTPAVLIP RHDTEVLVTE AVKRGGACRS 
ILDIGTGSGC VAIAVAKALP EAEVCTVDVS GEAIEVARGN AERNGVSVQF FQGSLFEPFA 
GKRFDMLVSN PPYITSADLA SLQQEVRDFE PAGALDGGGD GLDFYRRITA GAPAHLNPGG 
WLLFEVGAGQ AGEVLELLNS GGFTNERFSQ TDPAGIERVV GARLQ