Gene Msil_0103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_0103
Symbol
ID	7090420
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	94471
End bp	95523
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	62%
IMG OID	643463437
Product	arsenical-resistance protein
Protein accession	YP_002360447
Protein GI	217976300
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0798] Arsenite efflux pump ACR3 and related permeases
TIGRFAM ID	[TIGR00832] arsenical-resistance protein

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCTTTT TTGAACGCAC GCTCTCCCTG TGGGTATGCG CCTGCATCGT TGCGGGCGTC 
ATTCTCGGCC AATTGGCGCC GGGGCTATTC CAGGCTATCG GCGCGATCGA AATCGCCAAG 
GTCAATCTGC CCGTTGCGGC GCTGATCTGG CTGATGATCG TTCCCATGCT GCTCAGGATC 
GATTTTGCGG CGCTCGGCGA AGTGCGGCGT CATTGGCGCG GCATGGGGGT GACGCTGTTT 
ATCAATTGGG CGGTGAAGCC CTTTTCGATG GCGGCGCTCG GCTGGCTGTT TATCGGCCAT 
TTTTTCCGGC CGTTTCTACC GGCCGATCAA ATCGACTCTT ATATTGCGGG CCTTATTCTT 
CTGGCCGCGG CGCCCTGCAC GGCGATGGTT TTCGTCTGGT CCAATCTCGT CAAGGGAGAG 
CCGCATTTCA CCCTGAGTCA GGTGGCGCTG AATGACGTCA TCATGGTTGT GGCTTTCGCG 
CCCCTGGTCG GGCTTCTGCT CGGCCTGTCG GCGATCGTCG TGCCATGGGA CACGCTCGCT 
TTGTCTGTCG GGCTCTACAT CGTGATTCCT GTCATTGCAG CGCAATTGGC CCGGCGCGCG 
CTGCTTGCCG GCGGCGCCGA CGCCTTCGCG CGCGTCCTGG CCATTCTACA GCCATTGTCG 
CTTGCCGCAT TGCTCGCGAC CTTGGTGCTG TTGTTCGGGT TCCAGGGCGA GCAGATCGCC 
GCTCAGCCGC TGGTTATTTT GATGCTCGCC GCGCCGATCC TGATCCAGGT TTATTTCAAC 
GCGGGGCTTG CCTATCTGCT CAATCGGATC GTCGGCGAGC CGCATTGCGT CGCCGGGCCC 
TCCGCGATGA TCGGCGCCAG CAATTTTTTT GAGCTCGCCG TCGCCGCCGC GATCAGCCTG 
TTTGGCTTCC GGTCCGGCGC GGCGCTGGGG ACGGTCGTCG GCGTGCTGAT CGAAGTCCCG 
GCGATGCTGT CTCTTGTCTA TATCGTCAAC GCCAGCCGCG GCTGGTATGA GCGCGCGGAG 
CCGGCGCCGG CGCCGCGACG GGCGGAGGGA TAA

Protein sequence

MSFFERTLSL WVCACIVAGV ILGQLAPGLF QAIGAIEIAK VNLPVAALIW LMIVPMLLRI 
DFAALGEVRR HWRGMGVTLF INWAVKPFSM AALGWLFIGH FFRPFLPADQ IDSYIAGLIL 
LAAAPCTAMV FVWSNLVKGE PHFTLSQVAL NDVIMVVAFA PLVGLLLGLS AIVVPWDTLA 
LSVGLYIVIP VIAAQLARRA LLAGGADAFA RVLAILQPLS LAALLATLVL LFGFQGEQIA 
AQPLVILMLA APILIQVYFN AGLAYLLNRI VGEPHCVAGP SAMIGASNFF ELAVAAAISL 
FGFRSGAALG TVVGVLIEVP AMLSLVYIVN ASRGWYERAE PAPAPRRAEG