Gene Msil_0138 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_0138
Symbol
ID	7090454
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	133942
End bp	135006
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	67%
IMG OID	643463472
Product	TonB family protein
Protein accession	YP_002360482
Protein GI	217976335
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0810] Periplasmic protein TonB, links inner and outer membranes
TIGRFAM ID	[TIGR01352] TonB family C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCAGA AGACTTTTCG CGGCGATGAT GCCTCAGCGA TCCTGACCGG CGCCTGCGCG 
GCGCCGGGCG GCCAAGATGA CTCGCTCTTG ACGGATGAGT CGGCGCTTAC GGCCGGCGCC 
GAGGACCATC TGGCCGAGCC GGCTCCCGCT GCGGAGGCGT CGCGGCGGCG GTTCTGGCTC 
ATTCTCGCCG CCTGCCTCTT CGCCCATGCG CTGATTCTCG CCGCGATCCT TTACGAAAAC 
AATGTGCAGC CGCCGATCGC CCCGGTCGAG GAGATCCCGG TCGAGCTCGT GCAGGAGATT 
CCGCAGCCCA AGGTCGAACC TCCGCCTCCG CCGCAGCCCC CTAAAAAAGA GGAAAAGCGG 
CCGAAGCAAA AAATAGAAGA CGACGACCGC GTCGCCTACG ACGCGCCGCG TGCGGAGAAC 
AAGGAAAAGA TCGAGCGCGA GGCGCCAGAT CCCGAGACCA AGGCGCAGCG CCAGGCGCCG 
CCCTCCGAGC AGACGGCCGA GACCCCGTCC CCGCCGCAAA AGGCGGAGGC GCCGCCTATC 
GCCACAGTGA TCGCGCCGCC CGAGGAAGCG CCGGCGAAAA TCGCCGACGA CAAACCGGAC 
GCCGAGCCTC TCGACAAGGC CACGCCCTCG CCAAAGAAGA AGCCGACCGA GGCGAAGTCG 
CCGGTCGTCT CAAAGGCGCC GCCGACCAAA TCCAAGAAGC AGAGCGTCGC GGACCAGCTC 
GCCTCGCTGG CGCCGACGCC CGACTACAAG GTGGGATCGG CGGCAAAGCC CTCGCCCGTC 
GCCGGCGGCG CGGCCAAGAC GACCTATCTC TCGATCCTCT ACGGCCTCAT CATGCGCCAG 
ATGCATGTGC CGGCGGACCT TCAGAATGGC CATCAGCAGG CCGACGGCAT CGTCGCCTTT 
TATGTCGACG AAAGAGGCAA TCTCACGCAT CAGGCGATCT ATCGCGCCAG CGGGCGCCCG 
GACTTTGACG CGGCGGCGCT GAATGCGGTG CGCCGCGCCG CGCCCTTCCC TGCCCCGCCG 
CGAGGCGATC CACACTCGAT CTGGTTTCAC TACGATACGC GGTGA

Protein sequence

MLQKTFRGDD ASAILTGACA APGGQDDSLL TDESALTAGA EDHLAEPAPA AEASRRRFWL 
ILAACLFAHA LILAAILYEN NVQPPIAPVE EIPVELVQEI PQPKVEPPPP PQPPKKEEKR 
PKQKIEDDDR VAYDAPRAEN KEKIEREAPD PETKAQRQAP PSEQTAETPS PPQKAEAPPI 
ATVIAPPEEA PAKIADDKPD AEPLDKATPS PKKKPTEAKS PVVSKAPPTK SKKQSVADQL 
ASLAPTPDYK VGSAAKPSPV AGGAAKTTYL SILYGLIMRQ MHVPADLQNG HQQADGIVAF 
YVDERGNLTH QAIYRASGRP DFDAAALNAV RRAAPFPAPP RGDPHSIWFH YDTR