Gene Msil_0037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_0037
Symbol
ID	7092365
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	32603
End bp	33811
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	60%
IMG OID	643463370
Product	OmpA/MotB domain protein
Protein accession	YP_002360382
Protein GI	217976235
COG category	[N] Cell motility
COG ID	[COG1360] Flagellar motor protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCCGAGA AAGAGCATCA GGAAATCGTC ATCGTAAAGC GCTACAGCCG TGACGACGAG 
GCAAGGCATG GCGGCGCATG GAAGATCGCC TTCGCCGATT TTATGACCGC CATGATGGCG 
CTTTTTCTCG TGCTTTGGCT GATCAGCTCG ACGAGCGACA AGACCAAACA TTCGGTCGCC 
CAATATTTCA ATCCGGTGAA GCTGGTCGAC ATGACAACCC TGAAAAAGGG ATTCCGCGAC 
CCGAAAAAAA CGGAGATGGG CGCCGGACCG AAGACGACGG AATCGGAAAT TGACGCCGAT 
AGCAACAAGG ATCTCGCCGA AACGCAGGAG GTCGCCGAAC ATCCTGGCGC CAAGGTTCGG 
CTTATTTCGG AATCGAAGCT GTTTCGCGAT CCTTACGCCG CGCTTGCGGA AATCGCGGCG 
AACGCAATCG AGGCGGCGCC GCATCCGAGT TCCGGCGAAC CGCAATCCGG ACCGACCGAA 
TTTTCTGTAG AATCATCCGA TGTTTTCGTT GATCCGTTTA CGACGGCGCC TCGTCTGGCG 
GATACAACTG TCGACGGACC GGCTTCCCAT GCAAAGCCAG CAATTCCCGA ACGCGACAAG 
CAGGCGCCTT CAAGTCCGAA GCAACGCGCC GAACCTTTGC CGCACGCGGA GGAGCAACTG 
AGTCCGCCGG CGGGAGCCGG CAAGGGGACA AAGACCGGGG ACGCCGCCAC CGAAGCGGCG 
ATGGCGTCCG CGCAGCCCAT GGATACGGAA ACGGCAAGCT TGAAAGCGGG CTTGACGGCG 
CTGGCGCCGC AGAAGGGGCG CTTCGGCGAC GGCCCGCGGA TCGAAGTCGA GAACACGGAC 
GAGGGCCTTC TGATCAGCCT TACGGACGAT CGCAAATTTT CGATGTTCGC GATCGGATCG 
GCGGCGCCTC TGCCACAGAC CATTGAGGCG ATGGCGAAGA TCGGCGATCT CTTGAAGACG 
CGCTCCGGCA TGGTTGTTGT TCGCGGCCAT ACCGACGCGC GCCCCTTCAA ATCCGCGACC 
TATGACAATT GGCGGCTCTC CACGGCGCGG GCGCATATGG CGCAATACAT GCTGACGCGC 
GGCGGTCTCG ACGAGAAGCG TATCGAAAAG ATCGAAGGCT TCGCCGATCA TCGCCTGAAA 
GTAGCGGCCG AGCCGACGGC GGCTGCAAAT CGCCGGATCG AAATCTTGTT GCGAAAGGTG 
AAGTCGTGA

Protein sequence

MAEKEHQEIV IVKRYSRDDE ARHGGAWKIA FADFMTAMMA LFLVLWLISS TSDKTKHSVA 
QYFNPVKLVD MTTLKKGFRD PKKTEMGAGP KTTESEIDAD SNKDLAETQE VAEHPGAKVR 
LISESKLFRD PYAALAEIAA NAIEAAPHPS SGEPQSGPTE FSVESSDVFV DPFTTAPRLA 
DTTVDGPASH AKPAIPERDK QAPSSPKQRA EPLPHAEEQL SPPAGAGKGT KTGDAATEAA 
MASAQPMDTE TASLKAGLTA LAPQKGRFGD GPRIEVENTD EGLLISLTDD RKFSMFAIGS 
AAPLPQTIEA MAKIGDLLKT RSGMVVVRGH TDARPFKSAT YDNWRLSTAR AHMAQYMLTR 
GGLDEKRIEK IEGFADHRLK VAAEPTAAAN RRIEILLRKV KS