Gene Mchl_4334 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mchl_4334
Symbol
ID	7116497
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium chloromethanicum CM4
Kingdom	Bacteria
Replicon accession	NC_011757
Strand	-
Start bp	4576525
End bp	4577793
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	72%
IMG OID	643527032
Product	Arsenical pump membrane protein
Protein accession	YP_002423038
Protein GI	218532222
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1055] Na+/H+ antiporter NhaD and related arsenite permeases
TIGRFAM ID	[TIGR01131] ATP synthase subunit 6 (eukaryotes),also subunit A (prokaryotes)

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.423319
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTGCGC TGATCCCGAA CCCGAACGCG GCGACCTGGG GTATCGCCGC GCTGGCGACG 
CTCGGCGTGA TCCTGCGCCC GTTCTCCTGG CCTGAAGCGA TCTGGGCGGT GCTCGGCGCG 
GCGCTCCTCG TCCTCCTCGG CCTGATCCCC TGGCAGAATG CCCTGGAGGG CGCAGCCAAG 
GGGACCGACG TCTACCTCTT CCTCGTGGGG ATGATGCTGC TCTCCGAGAT CGCCCGGAAG 
CAGGGCCTGT TCGATTGGCT CGCCGCCCAC GCGGTGCGGG CCGCCAAGGG GTCGCCGACG 
CGGCTGTTTG CGCTCGTCTA CGTCGTCGGC ACGGTGGTTA CGGTCTTCCT CTCGAACGAT 
GCCTGCGCGG TGGTGCTGAC GCCCGCCGTC TTCGCCGCGA CGCGGGCCGC CGGGGTGAAG 
CAGCCCCTGC CCTACCTGTT CGTCTGCGCC TTCATCGCCA ACGCGGCGAG CTTCGTGCTG 
CCGATCTCGA ACCCGGCCAA CCTCGTCGTC TTCGCCGAGC ACATGCCGCC GCTCGGCCGC 
TGGCTGGCGA CCTTCACCCT GCCCTCCCTC CTCGCCATCG TCGCGACCTA TCTCGTCCTG 
CGCCAGACCC AGAACGCGCG GCTGAAGGCC GAGACGGTCG CGACCGACGT CGCAATCCCG 
AGGCTCGAGC TCGGCGGCAC GATCGCGGCC GGGGGCATCG TCGCCACCGG CGCGGCCCTG 
ATCGGCGCCT CGGCCGCCGG GATCGAACTC GGTCTTCCGA CCTTCATCGC CGGACTCGCC 
ACCACCCTCG TCGTGCTCGC GATCAATCGG GGCGGGCTGG TCGCGGTCGC TCGGGACGTC 
TCCTGGGGCG TGCTGCCTCT GGTCGCCGGG CTCTTCGTCC TCGTCGAGTC CCTGGAGAAG 
ACCGGCCTCC TCGCAAGGCT CGCCGACCTC CTGGGCCGCG CCGCGCAGGG CGATCCCGCC 
GCGACGGCTT GGGCCGGCGG CGTGCTCGTC GCGTTCGGAT CGAACCTCGT GAACAACCTG 
CCGGCGGGCC TCCTGGCGGG CGCCGCGGTG CAGGCCGCCC ATGTGCCGGA GACGGTGGCG 
GGGGCGATCC TGATCGGCGT CGATCTCGGG CCGAACCTCT CGGTCACGGG CTCGCTCGCC 
ACGATCCTCT GGCTCACCGC GATCCGCCGC GAGGGCCAGA ACGTCTCCGC CTGGGCGTTC 
CTGAAGCTCG GCGCCCTCGT CATGCCCCCG GCGCTGGCGC TGGCCCTCGC GGCTCTGATC 
CTCGCCTGA

Protein sequence

MGALIPNPNA ATWGIAALAT LGVILRPFSW PEAIWAVLGA ALLVLLGLIP WQNALEGAAK 
GTDVYLFLVG MMLLSEIARK QGLFDWLAAH AVRAAKGSPT RLFALVYVVG TVVTVFLSND 
ACAVVLTPAV FAATRAAGVK QPLPYLFVCA FIANAASFVL PISNPANLVV FAEHMPPLGR 
WLATFTLPSL LAIVATYLVL RQTQNARLKA ETVATDVAIP RLELGGTIAA GGIVATGAAL 
IGASAAGIEL GLPTFIAGLA TTLVVLAINR GGLVAVARDV SWGVLPLVAG LFVLVESLEK 
TGLLARLADL LGRAAQGDPA ATAWAGGVLV AFGSNLVNNL PAGLLAGAAV QAAHVPETVA 
GAILIGVDLG PNLSVTGSLA TILWLTAIRR EGQNVSAWAF LKLGALVMPP ALALALAALI 
LA