Gene Mext_3341 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_3341
Symbol
ID	5833486
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	3704640
End bp	3705608
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	71%
IMG OID	641369141
Product	aliphatic sulfonate ABC transporter periplasmic ligand-binding protein
Protein accession	YP_001640799
Protein GI	163852756
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence [TIGR01728] ABC transporter, substrate-binding protein, aliphatic sulfonates family

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCTGA CCCGCCGCCA CTTCGCCCTC TCATCGAGCG CCGCGCTCGC CGCCGGCCTC 
GTCCTCGGTC GCTCCGGCCC GGCCCGCGCC GGACGGACGG TGAAGCTGAG TTATCAGCGC 
TCCTCGACGC TCCTCACGGT GCTGAAGGCG CGGGGCACCC TGGAGGAGCG GCTCGGCGCG 
CAAGGGCTCG GCGTGAGCTG GCACCTCTTC ACCAAGGTGC TCGAACCGAT GAACACCGGC 
GCGGTCGATC TCCACGCCGA TGTGGCCGAC GCGGTGCCGA TCTTCACCCA ATCGGCAGGA 
GCCCCGCTGA CCTTCTACGC CATGGAGGCC GGTTCTCCGC GGGCCGAGGC GATCATCGTA 
CCGGACGAGT CGCCGATCCG CACGGTCGCG GATCTGAAAG GCCGCACGGT CGGCGTCTCG 
AAGGGCTCGG GCTGCCACTT CATCCTCGCG GGCGCGCTGA AGCGGGCGGG CCTGCGGTTC 
GCCGACATCC GCCCGGCCTA TCTGGAGGCG GCGGACGGGC TCGCGGCGTT CGAGCAGGGC 
GGCATCGAGG CGTGGTCGAT CTGGGATCCG TTCCTGGCCA TCGTACAGGC CAAGCGCCCG 
GTTCGGGTGC TGGCCGATGC CACCGGCCTG TCGAGCTACA ACCGCTACTA CACGGTCAAC 
GACCGCTTCG CCGCCGAGCA GCCGGAGGTC GTCGCCACGG TCTTTTCCGC CCTGGTCGAG 
GCGGGACAAT GGGTGAAGGC CAACCCGTCG GCGGCCGTTG CGCTGCTGGC GCCGATCTGG 
GGAGACCTGC CGCCGGCGGT GGTCGCCACC GTCAACGAGC GGCGCTCCTA CGCGGTCAGG 
GCCGTCGATC GGGCCGCGCT CTCCGAGCAG CAGGCCATCG CCGACACCTT CCACGAGGCC 
GGGCTGATCC CGCGCCGGCT CGACGCCACC GCCGTATCGC TCTGGCAGCC GCCGGCAGGA 
CGCGGGTGA

Protein sequence

MSLTRRHFAL SSSAALAAGL VLGRSGPARA GRTVKLSYQR SSTLLTVLKA RGTLEERLGA 
QGLGVSWHLF TKVLEPMNTG AVDLHADVAD AVPIFTQSAG APLTFYAMEA GSPRAEAIIV 
PDESPIRTVA DLKGRTVGVS KGSGCHFILA GALKRAGLRF ADIRPAYLEA ADGLAAFEQG 
GIEAWSIWDP FLAIVQAKRP VRVLADATGL SSYNRYYTVN DRFAAEQPEV VATVFSALVE 
AGQWVKANPS AAVALLAPIW GDLPPAVVAT VNERRSYAVR AVDRAALSEQ QAIADTFHEA 
GLIPRRLDAT AVSLWQPPAG RG