Gene Mchl_1049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mchl_1049
Symbol
ID	7118552
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium chloromethanicum CM4
Kingdom	Bacteria
Replicon accession	NC_011757
Strand	+
Start bp	1064720
End bp	1065787
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	66%
IMG OID	643523842
Product	arsenical-resistance protein
Protein accession	YP_002419884
Protein GI	218529068
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0798] Arsenite efflux pump ACR3 and related permeases
TIGRFAM ID	[TIGR00832] arsenical-resistance protein

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCCTGT TCGAACGTTA CCTGACCCTC TGGGTCGCGC TCTGCATCGT GGCCGGCATC 
GCGCTCGGTT ACGTCATGCC CGGCTTCTTC CACGCCGTGG GCGAGGCGGA GGTCGCCAAG 
GTGAACCTGC CGGTGGCCGC CCTGATCTGG CTCATGGTCA TCCCCATGCT GCTCAAGATC 
GACTTTGCGT CCTTGCGCCA CGTCGGGCGG CACTGGCGCG GGATCGGCGT GACGCTGTTC 
ATCAACTGGG CGGTGAAGCC GTTCTCGATG GCCGCGCTCG GCTGGCTGTT CATCGGCTAT 
CTTTTTCGGT CCTACCTGCC CGCCGACCAG ATCGACAGCT ACATCGCCGG GCTCATCATC 
CTGGCGGCGG CCCCCTGCAC CGCCATGGTG TTCGTCTGGT CGAACCTGAC GCGGGGCGAA 
CCGCACTTCA CCCTGAGCCA GGTGGCGTTG AACGACAGCA TCATGGTGGT GGCCTTCGCC 
CCCATCGTCG GGTTGCTGTT GGGCCTCTCG GCGATCACGG TGCCCTGGGG AACGCTAGTC 
CTGTCGGTGG TGCTCTACAT CGTCATCCCG GTCATCATCG CGCAGGTGGT CCGCGGCAGC 
CTTCTCGCCT CGGGCGGCCA AGCCGCCCTC GATCGACTCC TTGCCAAGCT CGGTCCGGTC 
TCGCTGGTGG CGTTGCTGGC CACCCTGGTG CTGCTGTTCG GCTTCCAGGG CGAGCAGATC 
CTGGCGCAGC CCGCGGTCAT CGGCCTGCTC GCGGTGCCCA TCCTCATCCA GGTCTACTTG 
AACTCAGGGT TGGCTTACCT GCTGAACCGC GTCGCCGGCG AGCAGCACTG CGTCGCCGGA 
CCCTCGGCCC TGATCGGTGC CTCAAACTTC TTCGAGCTTG CGGTGGCCGC CGCCATCAGC 
CTGTTCGGTT TCAACTCGGG CGCGGCGCTC GCCACCGTTG TCGGCGTGCT CATCGAGGTC 
CCCGTGATGC TGTCCGTGGT CTTGATCGTG AACCGCAGCC AGGGTTGGTA CGAGCGCGGC 
GCGGCAGGCA AGGGAGCGGC CCTGAAGCCC GCCTCCCGTG AGACCTGA

Protein sequence

MSLFERYLTL WVALCIVAGI ALGYVMPGFF HAVGEAEVAK VNLPVAALIW LMVIPMLLKI 
DFASLRHVGR HWRGIGVTLF INWAVKPFSM AALGWLFIGY LFRSYLPADQ IDSYIAGLII 
LAAAPCTAMV FVWSNLTRGE PHFTLSQVAL NDSIMVVAFA PIVGLLLGLS AITVPWGTLV 
LSVVLYIVIP VIIAQVVRGS LLASGGQAAL DRLLAKLGPV SLVALLATLV LLFGFQGEQI 
LAQPAVIGLL AVPILIQVYL NSGLAYLLNR VAGEQHCVAG PSALIGASNF FELAVAAAIS 
LFGFNSGAAL ATVVGVLIEV PVMLSVVLIV NRSQGWYERG AAGKGAALKP ASRET