Gene M446_1991 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_1991
Symbol
ID	6135634
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	+
Start bp	2224411
End bp	2225682
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	74%
IMG OID	641642222
Product	arsenical pump membrane protein
Protein accession	YP_001768890
Protein GI	170740235
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1055] Na+/H+ antiporter NhaD and related arsenite permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.722795
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.961968
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCGCGC TCGGCGTCAC ACCCCACCTC GCCACCTGGG GCATCGCCGC GCTGGCGACG 
CTCGGCGTGA TCCTGCGCCC CCTCGGCTGG CCGGAAGCGG TCTGGGCCGT GCTCGGGGCG 
ATCGTGCTCG TCGCCCTCGG CCTGCTCCCC GCCGGCACCG CCTGGGACGG GGTCCTGAAG 
GGCACGGACG TCTACCTCTT CCTGATCGGC ATGATGCTGC TCGCCGAGGT CGCCCGGAAG 
GAGGGGCTGT TCGACTGGCT CGCCGGCATC GCGGTGCGGC GGGCGCGGGG CTCGGCGACG 
CGGCTCTTCA CCCTCGTCTA CGCGGTCGGC ACGGTCGTGA CGGTGTTCCT GTCGAACGAT 
GCCTGCGCGG TGGTGCTGAC GCCGGCGGTC GCGTGCGCCG CCAAGGCCGC CCGGGTGCGC 
GACCCGCTGC CCTACCTGCT GGTCTGCGCC TTCATCGCCA ACGCGGCGAG CTTCGTGCTG 
CCGATCTCGA ACCCGGCCAA CCTCGTCGTC TACGCGGCGC ACATGCCCCC GCTCGCCGAG 
TGGCTCGCCC GCTTCACCTT GCCCTCCGCG CTGGCGATCC TGGCGACCTA CGCGGCCTTG 
CGCCTCACGC AGGGCCCCAC CCTGCGCGCC CAGGAGGTGG CGACCGACGT GCCGCGCGCC 
GACCTGTCCC GCACCGGGCT CGTCGCCGGG CTCGGCATCC TGGCGACGGG GCTCGTGCTG 
ATCGCCGCCT CGGCGCGCGG CCTCGCTCTC GGCCCGCCGA CCTGCCTTGC GGGACTCGCC 
ACCGCGCTCC TCGTCCTGGC GCTGCGGCGG GAGGGTTTGG CCGAACTGGT CCGGGACGTG 
TCCTGGAGCG TGCTGCCACT CGTCGCCGGG CTGTTCGTGC TGGTCGAGGC CCTGGAGAGG 
ACCGGGGTGC TGCGCCTCGT CGCCGACACC CTGAGGGTGC AGGCGGGCGC CCATCCGGCC 
GGCACCGCCT GGGGGGCGGG CGCGCTCGTC GCTTTGCTCT GCAACCTCCT CAACAATCTG 
CCGGCCGGGC TGATCGCCGG CGCGGCGGTG CAGGCGGCGG AGGTCTCCGA CAGGATCGCG 
GGCGCGATCC TGATCGGGGT CGATCTCGGC CCCAACCTCT CGGTCACGGG CTCCCTCGCC 
ACGATCCTCT GGCTCACCGC GATCCGGCGG GAGGGGCAGC ATGTCGGGGC GTGGCGCTTC 
CTGGCGCTGG GAGCGCTGGT GATGCCGCCC GCCCTCCTGC TGGCGCTCGC CGGCCTCCTC 
CTCGTGCCCT GA

Protein sequence

MGALGVTPHL ATWGIAALAT LGVILRPLGW PEAVWAVLGA IVLVALGLLP AGTAWDGVLK 
GTDVYLFLIG MMLLAEVARK EGLFDWLAGI AVRRARGSAT RLFTLVYAVG TVVTVFLSND 
ACAVVLTPAV ACAAKAARVR DPLPYLLVCA FIANAASFVL PISNPANLVV YAAHMPPLAE 
WLARFTLPSA LAILATYAAL RLTQGPTLRA QEVATDVPRA DLSRTGLVAG LGILATGLVL 
IAASARGLAL GPPTCLAGLA TALLVLALRR EGLAELVRDV SWSVLPLVAG LFVLVEALER 
TGVLRLVADT LRVQAGAHPA GTAWGAGALV ALLCNLLNNL PAGLIAGAAV QAAEVSDRIA 
GAILIGVDLG PNLSVTGSLA TILWLTAIRR EGQHVGAWRF LALGALVMPP ALLLALAGLL 
LVP