Gene Mext_0049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_0049
Symbol
ID	5834000
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	55414
End bp	57084
Gene Length	1671 bp
Protein Length	556 aa
Translation table	11
GC content	69%
IMG OID	641365833
Product	sulphate transporter
Protein accession	YP_001637548
Protein GI	163849505
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0659] Sulfate permease and related transporters (MFS superfamily)
TIGRFAM ID	[TIGR00815] high affinity sulphate transporter 1

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGGCC TCGGATCGAC GACGCGGACC TCCACGACCG ACGCGCCGAC GAAACTCCGC 
TCCGACATTC TGGCAGGGCT CACCGCCGCG GCCGTCGTCC TCCCCAAGGC GATGGCTTTC 
GCCACGGTGG CCGGGCTGCC GGTCGCGGTC GGCCTCTACA CCGCCTTCGT TCCCACGCTC 
ATCTATGGCC TGTTGGGCTC ATCCCACGTC CTGAGCGTCA GTTCGACGAC GACGCTGGCG 
ATCCTGACAG CCGCCGAAAT CGGCAGCGTG GTGCCGGATG GCGATCCGGC GCGGCTGGTT 
GCCACCACAG CGACGCTGAC GGCCCTTGTC GGCGCGCTGC TGCTCGGAGC CCGGCTGGTG 
AAGCTCGGCT TCATCGCCAG CTTCATCTCC GTGCCGGTCC TGACCGGGTT CAAGGCCGGA 
ATCGCCTGCG TGATCCTGCT GGACCAAGCT CCCAAGCTGC TCGGGCTCCA TTCCGCGAAG 
CAGTCGTTCT TCATCGATCT CGCGAGTCTC GTTCGCCACC TCCCCGAGAC GTCGCTGCCG 
ACCCTGGCTG TCGCAGGGGT GACGCTGGCC GTCCTCGTCG GCGCTGAGCG CCTCAGGCCC 
CATTCGCCGG TTCCGCTGGT CACGGTCGCT GCCGCCGTCG CGGCCTCTTG GCTGCTCGGC 
CTCAACGCAT GGGGAGTCGC GACGGTCGGG GAGATCCCGC CGGGGCTCCC CTCCGTGAGC 
ATGCCCGACC TGACGCTTGT CCAGGCGCTC CTGCCGGGCG CCATGGGCAT CGCCCTGATG 
AGCTTCACGG AGAGCATCGC CGCGGGCCGG GCCTTCGTGG CTTCGGGAGA TCCGCCCATC 
GATGCCAATC GTGAACTGGT CGCCACGGGT GCAGCGAATT TGGGGGGAGC CTTGCTCGGG 
GCGATGCCGG CCGGCGGCGG GGCATCGCAG ACCGGGGTCG TGCGGGCCGC CGGAGGCCGG 
ACGCAGGCGG CCTCATTCGT GACGGCCGCG CTTGCCCTCG CGACGATGCT GCTCCTGTCG 
CCGGTCCTGG GCCTCCTGCC GCAGGCAACC CTCGCGGCGG TCGTGATCGT CTACTCGGCC 
AGCCTCATCC AGCCGGCGGA GTTCCGGGAC ATCTTCAAAG TGCGGCGGAT GGAGTTCCAC 
TGGGCAATCG TGGCGGGGAT CGGGGTGCTC GTCTTCGGGA CGCTTCAGGG TATCACCGTC 
GCCATCGTCC TCTCGCTGGT CGGCCTGGGC CTCCAGACGG CCCATCCCCG CATCTCTGTC 
ATCGCCCGCA AGCACGGCGC GGACGTGCTG CGCCCCCTGT CGCCGGAGCA CCCCGATGAC 
GAGACGTTCG TCGGCCTCCT GATCCTGCGC CCGGAGGGGC GCCTGTACTT TGCCAACGCG 
CAGAACGTGG CAGACCGGAT TCGGGCGCTC ATTGCCGAGC ACAAGCCGCG TATCGTCGCC 
CTCGACCTCA GCCGTGTGCC CGACATCGAG TATTCGGCGC TGCAGATGCT GCGGGATGGT 
GCCCGGCGGA CCAGCATGAC GTTTTGGCTC GTAGGCCTCA ACCCTGACGT CCTGAACATG 
GTGCGGCGCG CCGGTTTGGA TCAGGAACTC GGACCGGACC GCCTGTTGTT CAACGCGCGA 
ACCGCCATCG AGCGCTACAA GGCGCTTCTG GCGCCCTCGG CGCCTGACTA G

Protein sequence

MTGLGSTTRT STTDAPTKLR SDILAGLTAA AVVLPKAMAF ATVAGLPVAV GLYTAFVPTL 
IYGLLGSSHV LSVSSTTTLA ILTAAEIGSV VPDGDPARLV ATTATLTALV GALLLGARLV 
KLGFIASFIS VPVLTGFKAG IACVILLDQA PKLLGLHSAK QSFFIDLASL VRHLPETSLP 
TLAVAGVTLA VLVGAERLRP HSPVPLVTVA AAVAASWLLG LNAWGVATVG EIPPGLPSVS 
MPDLTLVQAL LPGAMGIALM SFTESIAAGR AFVASGDPPI DANRELVATG AANLGGALLG 
AMPAGGGASQ TGVVRAAGGR TQAASFVTAA LALATMLLLS PVLGLLPQAT LAAVVIVYSA 
SLIQPAEFRD IFKVRRMEFH WAIVAGIGVL VFGTLQGITV AIVLSLVGLG LQTAHPRISV 
IARKHGADVL RPLSPEHPDD ETFVGLLILR PEGRLYFANA QNVADRIRAL IAEHKPRIVA 
LDLSRVPDIE YSALQMLRDG ARRTSMTFWL VGLNPDVLNM VRRAGLDQEL GPDRLLFNAR 
TAIERYKALL APSAPD