Gene Smed_5054 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5054
Symbol
ID	5319356
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	-
Start bp	1807
End bp	2886
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	59%
IMG OID	640776834
Product	arsenical-resistance protein
Protein accession	YP_001313766
Protein GI	150377171
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0798] Arsenite efflux pump ACR3 and related permeases
TIGRFAM ID	[TIGR00832] arsenical-resistance protein

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCGTCCCG CTCAGCCCAC AATCCGCCTC TCGTTCCTCG ACCGCTATCT GACAGTCTGG 
ATATTTACCG CCATGGCGCT CGGCCTTGTG CTCGGCACGG TTTTCACGGG CCTGCCGGCA 
GCCCTCGATG GTCTTTCCGT CGGGACCACC AACGTTCCGA TCGCGATCGG ACTCATCCTT 
ATGATGTATC CGCCGCTCGC CAAGGTGCGT TACGAGGAGC TCCATCAGGT CTTTGCCGAC 
AAGCGTATAC TAACGCTCTC GCTGGTGCAG AACTGGCTGA TCGGCCCGGT GCTCATGTTC 
GGGCTCGCCG TGCTGTTCCT GCGCGACTAT CCGGAATATA TGACGGGCCT TATCCTGATC 
GGTCTCGCTC GCTGCATCGC CATGGTCCTT GTCTGGAATC AACTCGCCCG CGGCGACAAT 
CAGTATGTTG CAGGTCTCGT CGCCTTCAAT TCGATCTTCC AGATCCTCTT CTTCAGCATA 
TACGCCTGGT TCTTCCTCAC CTTTCTGCCG CCACTCTTCG GGCTGGAAGG AAGCGTCATC 
GACGTGTCCT TCTGGACGAT CGCCGAGGCA GTGCTGATCT ATCTCGGAAT ACCGTTCCTC 
GCAGGTTACC TGTCGCGCCG CATCCTTACG AAGGCAAAAG GCGAGGACTG GTACGAGAAC 
GCCTTCCTGC CGAAGATCAG CCCGATCACG CTTGCGGCGC TGCTTTTCAC CATCGTCGCG 
ATGTTCAGCT TGAAGGGCGG CGATGTCGTA AGGCTGCCGT TCGATGTCGT CCTGATCGCG 
ATCCCCCTGA CGATCTACTT CGTCATCATG TTCACCGTCA GTTTCTTCAT GGCGAAACTG 
ATCGACACCG ATTATCCGCG TACCACCGCG GTTGCATTCA CGGCTGCGGG CAACAACTTC 
GAACTGGCGA TCGCCGTCGC CATTGCCGCC TTCGGTCTTG CGTCCCCGGT GGCCTTTGCC 
GCGGTCATCG GACCGCTTGT GGAAGTACCT GTGCTGATCC TGCTGGTGCA GCTCGCACTC 
TGGCTCGGCC GCCGCTACTT CGCCGAAACG GCTCCCGCGG CTGTCGCCTC TGAAGCATAA

Protein sequence

MRPAQPTIRL SFLDRYLTVW IFTAMALGLV LGTVFTGLPA ALDGLSVGTT NVPIAIGLIL 
MMYPPLAKVR YEELHQVFAD KRILTLSLVQ NWLIGPVLMF GLAVLFLRDY PEYMTGLILI 
GLARCIAMVL VWNQLARGDN QYVAGLVAFN SIFQILFFSI YAWFFLTFLP PLFGLEGSVI 
DVSFWTIAEA VLIYLGIPFL AGYLSRRILT KAKGEDWYEN AFLPKISPIT LAALLFTIVA 
MFSLKGGDVV RLPFDVVLIA IPLTIYFVIM FTVSFFMAKL IDTDYPRTTA VAFTAAGNNF 
ELAIAVAIAA FGLASPVAFA AVIGPLVEVP VLILLVQLAL WLGRRYFAET APAAVASEA