Gene Mfla_2348 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mfla_2348
Symbol
ID	4001444
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacillus flagellatus KT
Kingdom	Bacteria
Replicon accession	NC_007947
Strand	+
Start bp	2501114
End bp	2502205
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	60%
IMG OID	637939275
Product	extracellular solute-binding protein
Protein accession	YP_546456
Protein GI	91776700
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.585172
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCTTCC CTCGCGTACT CCGACTCATT GCCCTCACCC TACTGGTATC CGTTGCCGTC 
CCGGCGCAGG CAGAGACAGT GCTGCGCGTC TTCATCGGCG GCGCGGCGCA ACGACCTGAC 
CTGTTCCGAG CGCTTGCTGA TCGCTATGAA GCCAGCCATC CGGGTGTCCG CATCGAAATC 
GGCAGCGGCG CTGCCACTTC AGAGCTGCAA CGTAAATACC TTTCCGTCCT GCTCAATGCG 
CACGACCCCA GTTTTGACGC CTTGATGCTG GATATCGTCC ATCCCTACCA ATTCGCCACC 
GCTGGCTGGA TCGCCCCGCT AGACCCGTAT TTCGGCGAGG AGAGGCAGAC GCTGCTCGCC 
GACGGTTTGC CCATCTACCG CCAGACCAAC CTGATCAAGG GCAAGCTCTA CACCTTGCCC 
GCCGTGACCG ATGCCATGTT CATGTACTAT CGCAAGGACC TGCTGGCGCA ACACGGCATT 
GCACCACCGC AAACCTGGGA CGAGCTGGCA AATGCCGCGC AGACCATCCT GAAGCAGGAG 
AACAATCCTG CGCTGCAAGG GCTTTCCGTC CAGGGAGCGC CGATCGAAGG TACGGTGTGC 
AGCTTCCTGT TGCCTTACTG GAGCCAGGGC AAGGACATCC TCGACAGCAA CGGCAAATTG 
GCCTTGGACA AACCTGCGGC GTTGCGCAGC CTGCAACTAT GGAAAGGGCT GATCGACAAG 
AATGTGATCC GCCGCCACGT AGCCGAGGTC AAGACCGGCG ACACCGTCAA CACGTTTAAG 
GCTGGCAATG CGATCTTCGC CATCAACTGG GGCTTTGCCT GGGGCGCGTT CCAGAACGAT 
ACGGATTCCC GCGTCAAGGG TAAGGTCGGT GTCATCCGTA TACCGGCGGT GCAAGGAGGC 
GAGCATGCGA CCTGCCTGGG AGGATGGCAG TGGGCGCTCT CCAACTATTC GCGCAACAAG 
GCGCAAACGG CGGATTTCTT GCGCTTCCTA GCCTCGCCTG AAAGCGTGCG CTTCATTACT 
TTGCAAGGCG CATTGTTGCC GCCTTACCTG CCGCTTTATG ACGATGCGGA AGTCCAAGCC 
GTGATCCCCT GA

Protein sequence

MSFPRVLRLI ALTLLVSVAV PAQAETVLRV FIGGAAQRPD LFRALADRYE ASHPGVRIEI 
GSGAATSELQ RKYLSVLLNA HDPSFDALML DIVHPYQFAT AGWIAPLDPY FGEERQTLLA 
DGLPIYRQTN LIKGKLYTLP AVTDAMFMYY RKDLLAQHGI APPQTWDELA NAAQTILKQE 
NNPALQGLSV QGAPIEGTVC SFLLPYWSQG KDILDSNGKL ALDKPAALRS LQLWKGLIDK 
NVIRRHVAEV KTGDTVNTFK AGNAIFAINW GFAWGAFQND TDSRVKGKVG VIRIPAVQGG 
EHATCLGGWQ WALSNYSRNK AQTADFLRFL ASPESVRFIT LQGALLPPYL PLYDDAEVQA 
VIP