Gene Mext_1911 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_1911
Symbol
ID	5835735
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	2128071
End bp	2129366
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	69%
IMG OID	641367711
Product	arsenical pump membrane protein
Protein accession	YP_001639381
Protein GI	163851338
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1055] Na+/H+ antiporter NhaD and related arsenite permeases
TIGRFAM ID	[TIGR00935] arsenical pump membrane protein

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCGCGC TCGCCATCTT CCTCGTCACC CTGGTGTTCG TCATCTGGCA GCCCAGGGGC 
CTCGGAATCG GGTGGAGCGC GCTCGCCGGC GCTGGCGTCG CGCTGGCCAC GGGCGTGATC 
CACCCGGGCG ACATCCCGGT GGTCTGGCAC ATCGTCTGGG ACGCCACCTT CACGTTCGTG 
GCGCTCATCA TCATCTCGCT GCTGCTGGAC GAGGCCGGGT TCTTCCATTG GGCCGCCCTG 
CACATCGCTC GCTGGGGCGG TGGCCGGGGC CGGCGGCTGT TTCCCCTGGT GATCCTGCTC 
GGCGCGGCCA TCGCGGCGGT CTTCGCGAAC GACGGCGCCG CGCTGTTGCT CACCCCCATC 
GTGCTGGCGG TCCTGCTGCG GCTCGACTTC AAGCCGGCGG CGGCGCTCGC GTTCATCGTC 
GCCTGCGGGT TCGTGGCGGA TTCGACGTCC CTGCCGCTGG TGATCTCGAA CCTCGTCAAC 
ATCGTCTCGG CCAACTTCTT CGACGTGACC TTCGGCCGGT ACGCAGCCGT CATGGTGCCC 
GTGGACCTCG TGTCCCTGGC GGCGACGTTA TTGGTACTGT GGGCCTACTT CCGGCGTGAC 
GTGCCGGCGA CCTATCCCGT GGACGCCCTG GAACGCCCGG CCGAGGCGAT CCGCGACCCG 
CTCGTGTTCC GTGCGGCGTT CCCTCTGCTC GGCGTCCTGC TGCTCGCCTA CTTCGTCACC 
GCGCCGTTCG GGGTGCCGGT GTCGGTCGTG ACCTGTGCAG GCGCCGCGGT GCTGCTGCTG 
CTCGCGAACC GCGGCGGGAC CATCCCGATC CGCAAGGTTC TGACCGGGGC GCCCTGGCAG 
ATCGTCCTGT TCAGCCTCGG CATGTACCTC GTGGTCTACG GCCTGCGGAA CGCCGGCCTG 
ACCGACGAGC TGGCCAAGGG CTTGGTCTGG CTCGCGGGCC ACGGCCCATG GGTCGCCACG 
GTCGGCACCG GCTTCGCGGC GGCCATCCTA TCGTCGGTGA TGAACAACAT GCCGAGCGTG 
CTGATCGGCG CGCTCTCGAT CCAGCAGGCC CCGGACCTGT CGCCGCTGAC CCGCGAACTG 
ATGGTCTACG CCAACGTCAT CGGCTGCGAC CTCGGGCCGA AGTTCACGCC CATCGGCAGC 
CTCGCCACGC TGCTCTGGCT GCACGTCCTC GACAGCAAGG GCCAGAGGAT CACCTGGGGC 
CAGTACATGA AGGTCGGCCT CGTCATCACC CCGCCGGTGC TGCTGGTGAC GCTCCTCGCG 
CTCGCCGTCT GGCTCCCGGT CCTCGGTCCC CAATGA

Protein sequence

MLALAIFLVT LVFVIWQPRG LGIGWSALAG AGVALATGVI HPGDIPVVWH IVWDATFTFV 
ALIIISLLLD EAGFFHWAAL HIARWGGGRG RRLFPLVILL GAAIAAVFAN DGAALLLTPI 
VLAVLLRLDF KPAAALAFIV ACGFVADSTS LPLVISNLVN IVSANFFDVT FGRYAAVMVP 
VDLVSLAATL LVLWAYFRRD VPATYPVDAL ERPAEAIRDP LVFRAAFPLL GVLLLAYFVT 
APFGVPVSVV TCAGAAVLLL LANRGGTIPI RKVLTGAPWQ IVLFSLGMYL VVYGLRNAGL 
TDELAKGLVW LAGHGPWVAT VGTGFAAAIL SSVMNNMPSV LIGALSIQQA PDLSPLTREL 
MVYANVIGCD LGPKFTPIGS LATLLWLHVL DSKGQRITWG QYMKVGLVIT PPVLLVTLLA 
LAVWLPVLGP Q