Gene Namu_2102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_2102
Symbol
ID	8447713
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	2320625
End bp	2321521
Gene Length	897 bp
Protein Length	298 aa
Translation table	11
GC content	74%
IMG OID	645041225
Product	modification methylase, HemK family
Protein accession	YP_003201469
Protein GI	258652313
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG2890] Methylase of polypeptide chain release factors
TIGRFAM ID	[TIGR00536] HemK family putative methylases [TIGR03534] protein-(glutamine-N5) methyltransferase, release factor-specific

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.0088252
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0697027
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCGGC ATTCGCTGCG CGCGGCCATC CTGGACGCCA CCCGCACCCT GGAGGCGGCG 
GGGGTGGCCA GCGCGGACGT CGACGCGCAG GAACTGGCCG CGCATCTGAT GGGCGTGCCG 
CGAACCCGGC TGGGCCTGAC CCCGCTGGTC GAGCAGTCCT TCCTGACCGA CTACCAGGCC 
CTGGTGGAGC GCCGTGCGCA GCGGATCCCG CTGCAGCACC TGACCGGGTC GGTCCAGCTG 
GGCCGGGCCA CCGTTGCGGT CGGACCCGGG GTGTTCGTCC CCCGCCCGGA GACCGAGTCG 
CTGCTGGTCT GGGCCCTGCA TGCGATCGCC GCCGTGGAAC GGCCGGTCGT GGTCGACCTG 
TGCACCGGCA GCGGAGTGCT GGCCCTGGCC ATCGCCGCCG AACGGCCCGA CGCCCGGGTG 
ATCGGAGTGG AACGCTCCTC CGCCGCCCTG GCCTGGGCCC GGCGCAACGT GACCAACGCC 
GGGGCCGGCC GGACCAAAGT CGAGCTGCGC GGAGGGGACA TCTTCGACGA GCGGTTGCTG 
GTCGACCTGG AGGGTCTGGC CGACCTGGTC ACCGCCAACC CGCCCTACGT GCCCGAGGGC 
ACCGCGGTCG AACCCGAGGT GGCTGACCAC GATCCGCCCG AGGCGGTGTT CGCCGGACCG 
GACGGGCTGG CGGTCATCCG GCCGCTGCTC TCGGTGGCCG CGAGCCTGCT CAAGCTCGGG 
GGAGTGCTGG CCATCGAGCA CGACGACAGC CACGGCGAGA CGGTGCCCGC GTTGCTCCGG 
TCGCGGCGGG TGCTCACCGA CGTCGAGGAC CACTCCGACC TGGCCGGCCG CCCGCGGTTC 
GTCACCGCCA CCCGGGTGCG GATGACGACG GGCGCCGGGA AGACTGGCAC ACCGTGA

Protein sequence

MSRHSLRAAI LDATRTLEAA GVASADVDAQ ELAAHLMGVP RTRLGLTPLV EQSFLTDYQA 
LVERRAQRIP LQHLTGSVQL GRATVAVGPG VFVPRPETES LLVWALHAIA AVERPVVVDL 
CTGSGVLALA IAAERPDARV IGVERSSAAL AWARRNVTNA GAGRTKVELR GGDIFDERLL 
VDLEGLADLV TANPPYVPEG TAVEPEVADH DPPEAVFAGP DGLAVIRPLL SVAASLLKLG 
GVLAIEHDDS HGETVPALLR SRRVLTDVED HSDLAGRPRF VTATRVRMTT GAGKTGTP