Gene M446_1990 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_1990
Symbol
ID	6132931
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	+
Start bp	2222905
End bp	2224209
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	74%
IMG OID	641642221
Product	major facilitator transporter
Protein accession	YP_001768889
Protein GI	170740234
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.803027
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACC TGCGCCCCTC CGCACGCGCC GCGGAGCCGA GCCCGTCGCG CCGGGCGCTG 
CGCGGCCTCG ACGCGCTGAA CTTCTTCCTC GCCGACGTGC GCGACGGCCT CGGGCCCTAC 
CTCGCGATCT ACCTGCTGGC CGTGCGCGGC CCCGCCCAGG GCTGGAACGA GGCGACGATC 
GGCCTCGTCA TGACGGTGGC GGGCGTCGCC GGCCTGGCGG CGCAGACGCC CGCGGGCGCG 
CTCATCGACC GGACCCGGCG CAAGCCGGCC ATCGTCATCG CGGCGGCCCT CGCCGTGACG 
GCGAGCTGCC TCGTCCTGCC CTGGATCTCC AACGTCTACC TCGTGGCCGG CACGCAGGCC 
CTCGCCCACG TGGCCGGCGC GGTCTTCCCG CCGGCCCTCA CCGGCATCAC CCTCGGCCTC 
GTCGGGCCGC GGCTCTTCGC GCGGCGGATC GGCCGCAACG AGGGCTTCAA CCACGCCGGC 
AACGCGGTCT CGGCCCTCCT CGCGGCGGGC CTCGCCACCG TGTTCGGGCC GGCCATCGTG 
TTCTGGCTGA TGGGCCTCCT CGCGGCGCTC AGCATCGGCG CGATGCTGGT GGTGCCGCGG 
GCGGAGATCG ACGACGACCT CGCCCGGGGC CTTGACGGCC GCCAGCACGA TCCCTGCGAG 
CAGCCCTCGG GCCTCGCGGT GCTGCTGCGC AACCGCCCCC TCCTGCTCTT CGCCGCGCTC 
TGCGCCGCCT TCCACCTCGC CAACGCGGCG ATGCTGCCCT CGGTCGGCCA GCTGCTCACG 
AAGGTGGTGG GCAAGGACTA CGCCACCTCG CTCATCGCGA TCTGCATCGT GGCGGCCCAA 
TGCGTGATGG TGCCGATGGC GATTCTGGTC GGCGCCAAGG CCGACCGTTT CGGGCGCAAG 
CCGATCTTCC TCGCCGCCTT CGGCATCCTG GCCCTGCGCG GCATTCTCTA CACGCTCTCG 
GACGATCCCG TCTTCCTCGT GGCGGTGCAG TGCCTCGACG GGGTAGGGGC CGGGATCTAC 
GGGGCCCTCT TCCCGATCGT GGTCGCCGAC CTGACCCGCG GCAGCGGCCG CTTCAACGTC 
GCGCAGGGCG CGGTCGCCAC CGCGCAGGGC GTCGGCGCCT CCCTCAGCGC CGCCCTGGCG 
GGACTCGTGA TCGTCTCGGC CGGCTACGCG GCGGCCTTCC TGGTCCTGGC CGGGATCGCG 
GCCCTCGGCT TCGCCCTCTA CCTCTTCGCC ATGCCGGAGA CGCGCGGCCT CGCTCCGGGC 
CATCCGTCCC CGGCCGCGGC CCCGCTCGCC GTCCCGGCAG AGTGA

Protein sequence

MSDLRPSARA AEPSPSRRAL RGLDALNFFL ADVRDGLGPY LAIYLLAVRG PAQGWNEATI 
GLVMTVAGVA GLAAQTPAGA LIDRTRRKPA IVIAAALAVT ASCLVLPWIS NVYLVAGTQA 
LAHVAGAVFP PALTGITLGL VGPRLFARRI GRNEGFNHAG NAVSALLAAG LATVFGPAIV 
FWLMGLLAAL SIGAMLVVPR AEIDDDLARG LDGRQHDPCE QPSGLAVLLR NRPLLLFAAL 
CAAFHLANAA MLPSVGQLLT KVVGKDYATS LIAICIVAAQ CVMVPMAILV GAKADRFGRK 
PIFLAAFGIL ALRGILYTLS DDPVFLVAVQ CLDGVGAGIY GALFPIVVAD LTRGSGRFNV 
AQGAVATAQG VGASLSAALA GLVIVSAGYA AAFLVLAGIA ALGFALYLFA MPETRGLAPG 
HPSPAAAPLA VPAE