Gene Mchl_1898 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mchl_1898
Symbol
ID	7116713
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium chloromethanicum CM4
Kingdom	Bacteria
Replicon accession	NC_011757
Strand	-
Start bp	1957771
End bp	1958871
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	76%
IMG OID	643524662
Product	TonB family protein
Protein accession	YP_002420689
Protein GI	218529873
COG category
COG ID
TIGRFAM ID	[TIGR01352] TonB family C-terminal domain [TIGR02794] TolA protein

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCCGA TGCAGGCCCC GACATCTGCC CCGATGCCGG CTCCCGTGCC CGCTTACGCT 
GGGCAGGGGT TGCCCTCGGG CCCGTCCGAG GGAGGCGGCC AGGGGCGCCT CGCGGCCGCC 
TTCGCCCTGG CCCTGGCCCT GCACGCCGCG GGGCTGATCG GCATCACCTA TCTGCATCTG 
ACACCGCCCG CGCCGCCGGG CGAGCAGGAG ATCACCATCG ATCTCGCGCC GCAGATGGCG 
GAGGCCGAGA CGCAGGCCCC CGCCCAGACA GCGCAGTCCG AGGCGATCCC CGAGGAGGCC 
AAGCCCGAGG GCGAGCCGGA GACGGCCGAG CCGGTCGAGA TCCCGGACGA GGTGAAGCCC 
CCGCCTCCCC CCGAGATGAC GGAGGTGATG CCGGAGGAGG TGCAGCCGCC GCCTCCGCCG 
CCGGAAGCCG TCACGGAAGT TCCGCCCGAC ACGCTGCCCC CGCCGCCCGA GGAGCAGATC 
ATCGCCTCCG AGGCGCAGGA GGCGGAGCCG CTGGCGCCGC CCCCGCCCGT GGTGGCGAAG 
GTGCCGGAGC GGCCCAAGCC CGATCCCAAG ATCGAGGAGC GCCGCAAGGC CGCCCTGGAG 
AAGAAGCGCG AGGCCGAGCG CGAGGCACGC CGCCAGGAGA TCCTCGAGAA GAAGCGCGAG 
GAGGCGCAGA AGGAAGCGCG GATCAAGGCC GCCAAGGCGA AGGCGGAGCG CGATGCCGCC 
CGGCGTGCCC AGGCCGCGCA GGCGGGCAAT GCGCAGCGCA ACTCCGCCGC CACCTCGCGT 
CAGAGCGCGA CGGGCACGGC CGCCGCGGCC AGCGATCCCA ACGCCATGGC CGCCTGGAAG 
GGCTCCATCG CCGCGACGAT CCGCGGCCGG ATGAACCGCG AGGCCGCGGC CGGCACCAGC 
GGCGGCGTCG CGACCGTGCG CTTCACCGTG AGCCGCTCCG GCGCGGTGAG CGGTGCGGCC 
GTGACCGGCA GCAGCGGGGT CGGCGCCATC GACAGCGCCG CGCTCGCGGC GGTGCGCGGC 
GGCCTGCCGC CCGCCCCCGC CGGGGTGACG CAGCCGAGCC TCGCCGTCAC CGTGCCGCTG 
CGCTTCAGCC CTGGGCGTTA G

Protein sequence

MPPMQAPTSA PMPAPVPAYA GQGLPSGPSE GGGQGRLAAA FALALALHAA GLIGITYLHL 
TPPAPPGEQE ITIDLAPQMA EAETQAPAQT AQSEAIPEEA KPEGEPETAE PVEIPDEVKP 
PPPPEMTEVM PEEVQPPPPP PEAVTEVPPD TLPPPPEEQI IASEAQEAEP LAPPPPVVAK 
VPERPKPDPK IEERRKAALE KKREAEREAR RQEILEKKRE EAQKEARIKA AKAKAERDAA 
RRAQAAQAGN AQRNSAATSR QSATGTAAAA SDPNAMAAWK GSIAATIRGR MNREAAAGTS 
GGVATVRFTV SRSGAVSGAA VTGSSGVGAI DSAALAAVRG GLPPAPAGVT QPSLAVTVPL 
RFSPGR