Gene Mchl_2049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mchl_2049
Symbol
ID	7118749
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium chloromethanicum CM4
Kingdom	Bacteria
Replicon accession	NC_011757
Strand	-
Start bp	2148572
End bp	2149576
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	69%
IMG OID	643524799
Product	NMT1/THI5 like domain protein
Protein accession	YP_002420824
Protein GI	218530008
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.574504
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGGGA AAATGATGAG AGCGCTCCTC TGCGCCGGGG CGGCGCTGCT CGGGCTCGCT 
GCGGGCGGCG CGCGGGCAAC GGAGAAGGTG ACGCTCCAGC TCAAATGGGT GCCCCAGGCG 
CAGTTTGCCG GCTACTACGT CGCCCAGGCC AAGGGTTTCT ACAAGGAGGC CGGCCTCGAC 
GTGACGATCA AGCCGGGCGG GCCCGACGTG GCCCCGCCCC AGGTCATCGC GGGCGGCGGC 
GCCGACGTCG TCGTCGATTG GATGCCCTCG GCGCTCGCCT CGCGCGAGAA GGGCGTGCCG 
CTCGTCAACA TCGCGCAGCC GTTCAAGAAA TCGGGCCTGA TGCTGACCTG CCGGGCGGAT 
ACCGGCATCA AGTCGCCCGC CGACCTGAAG GGACGGACGC TCGGCGTCTG GTACGCCGGC 
AACGAATACC CGTTCCTGGC CTGGATGGCC AAGCTCGGCC TCAAGACCGA CGGCTCGCCC 
GGCGGCGTGA CGGTGCTGAA GCAGGGCTTC AACGTCGATC CGCTGATCCA ACGCCAAGCC 
GACTGCGTCT CGACCATGAG CTACAACGAG TATTGGCAGG TGATCGATGC CGGCTTCAAG 
CCGGAGCAGC TCGTCGTCTT CCGCTACGAG GACCAGGGCG TCGCCGCGCT CGAGGACGGG 
CTCTACGCCC TTGAATCCAA GCTGAAGGAC AAGGCCTTCG TCGCCCGGCT GGCGAAGTTC 
GTGGCGGCCT CCGAGAAGGG CTGGGCCTAT GCCGCCGCGC ATCCGGACGA GGCGGCCGAG 
ATCGTGCTGG AGAACGACGC CAGCGGCGCC CAAACCGAGA CGCACCAGAA GCGGATGATG 
CGCGAGATCG CCAAGCTGCT CGACACCTCC GGCGGCCGGC TCGACCCCGC CGATTACGAG 
CGCACCGTCG CGATCCTGCT CACCGGCGGC ACCGACCAGC CCGTCATCAC CCGCAAGCCC 
GAGGGGGCCT GGACGCATGC GGTGACCGCG ACCCTGGGGC AGTAG

Protein sequence

MAGKMMRALL CAGAALLGLA AGGARATEKV TLQLKWVPQA QFAGYYVAQA KGFYKEAGLD 
VTIKPGGPDV APPQVIAGGG ADVVVDWMPS ALASREKGVP LVNIAQPFKK SGLMLTCRAD 
TGIKSPADLK GRTLGVWYAG NEYPFLAWMA KLGLKTDGSP GGVTVLKQGF NVDPLIQRQA 
DCVSTMSYNE YWQVIDAGFK PEQLVVFRYE DQGVAALEDG LYALESKLKD KAFVARLAKF 
VAASEKGWAY AAAHPDEAAE IVLENDASGA QTETHQKRMM REIAKLLDTS GGRLDPADYE 
RTVAILLTGG TDQPVITRKP EGAWTHAVTA TLGQ