Gene Mext_1043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_1043
Symbol
ID	5833664
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	1136119
End bp	1137366
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	68%
IMG OID	641366838
Product	major facilitator transporter
Protein accession	YP_001638519
Protein GI	163850476
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.0605275
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAGCCG AAGCGATTGA GAATCCGGGG TTGCCCGGCC CGCCCGAGGT CGCCGTGACG 
GCACCGTCCC AAGCGCGCGG ACAAGCTTCC CCAGCTCTGG CGGTGCTCCT GGGACTCAGC 
CTCTCGCACC TCCTCAACGA TCTCGTGCAG TCGCTTCTGC CGGCGCTCTA TCCCCTGCTC 
AAGGCAGGCT TCCACCTCGA TTTCGGGCAG ATCGGCCTCA TCACCTTCGT GTTCCAGGGG 
ACGGCCTCGC TGCTCCAGCC GGCGGTCGGC CTCTACACCG ACCGGCGCCC GCTGCCCTAC 
TCGCTGGCCA TTGGCATGGT GCTGTCGCTG GCCGGGCTCG CCCTGTTGTC GGTGGCGTCG 
GCCTACGGGG CCCTGCTCGC CGCCGCCGCG CTGATCGGGC TCGGCTCCGC CATCTTCCAC 
CCCGAGGCGA GCCGAGTGGC GCGGCTCGCC TCCGGTGGCC GTTACGGTCT GGCGCAATCG 
GTGTTCCAGG TCGGCGGCAA TGCCGGCACG GCACTCGGGC CGTTGCTCGC CGCCTTCGTC 
GTGGTGCCGC ATGGCCAGGG CAGCGTCGCG TGGTTCTGCC TCGCCGCGCT CGCCGGCATC 
CTCGTGCTCG GCACGGTCGG CCGCTGGTAC GCGCAGCGGC TCGCCACGAC GCCGCGAACC 
GCAGGGAAGA GCACGGGCGC CGCCTCCGGC CGCCTCAGCC GGGTGCGGAT CGTGGCGACG 
ATCGCGATCC TGCTGGGGCT GATCTTCTCC AAGTACTTCT ACATGGCGAG CTTTTCGTCT 
TACTACACCT TCTACTTGAT TCACCGCTTC GGCGTACCGG TGGCGCTCGC GCAGGTCTAC 
CTGTTCGTCT TCCTCGGAGC GGTGGCGGCG GGGACGATTC TCGGCGGCCC CATCGGTGAC 
CGATTCGGGC GCAAGCTCGT GATCTGGATC TCGATTCTCG GCGTACTGCC GTTCTCGCTC 
GCCTTGCCGC ACGTGAATCT GTTCTGGACG GTGATTCTCT CGGTGCCGAT CGGACTGATT 
CTGGCGTCCG CCATGCCGGC GATCCTGGTC TATGCACAGG AATTGTTGCC GGGCCGGATC 
GGGCTCGTCG GCGGCCTGTT CTTCGGCTTC GCCTTCGGCA TGGGCGGCCT CGGCGCCGCG 
CTGCTCGGGG AGATGGCCGA CCATGTCGGC ATCGAGCGGG TCTACGATCT CTGCGCCTTC 
CTCCCCGCGC TGGGATTGAT GGCGGTGTTC CTGCCGCGGC TGCGGTGA

Protein sequence

MRAEAIENPG LPGPPEVAVT APSQARGQAS PALAVLLGLS LSHLLNDLVQ SLLPALYPLL 
KAGFHLDFGQ IGLITFVFQG TASLLQPAVG LYTDRRPLPY SLAIGMVLSL AGLALLSVAS 
AYGALLAAAA LIGLGSAIFH PEASRVARLA SGGRYGLAQS VFQVGGNAGT ALGPLLAAFV 
VVPHGQGSVA WFCLAALAGI LVLGTVGRWY AQRLATTPRT AGKSTGAASG RLSRVRIVAT 
IAILLGLIFS KYFYMASFSS YYTFYLIHRF GVPVALAQVY LFVFLGAVAA GTILGGPIGD 
RFGRKLVIWI SILGVLPFSL ALPHVNLFWT VILSVPIGLI LASAMPAILV YAQELLPGRI 
GLVGGLFFGF AFGMGGLGAA LLGEMADHVG IERVYDLCAF LPALGLMAVF LPRLR