Gene SNSL254_A1689 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A1689
Symbol
ID	6484494
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	1653144
End bp	1654631
Gene Length	1488 bp
Protein Length	495 aa
Translation table	11
GC content	58%
IMG OID	642737069
Product	methyl viologen resistance protein SmvA
Protein accession	YP_002040821
Protein GI	194443839
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	66
Fosmid unclonability p-value	0.815414
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTCGTC AGTGGTTAAC GTTAGTCATT ATTGTGCTGG TCTATATTCC TGTCGCCATT 
GATGCCACGG TCTTGCATGT CGCCGCGCCG ACACTGAGTA TGACACTGGG GGCCAGCGGC 
AACGAGCTGC TGTGGATCAT TGATATTTAT TCTTTGGTCA TGGCTGGCAT GGTGTTGCCG 
ATGGGCGCGC TTGGCGATCG TATCGGTTTT AAACGCCTGC TGATGCTGGG CGGGACGCTC 
TTTGGCCTGG CATCATTGGC GGCGGCGTTT TCGCATACCG CCAGTTGGCT TATCGCCACC 
AGGGTATTAC TGGCTATTGG CGCGGCGATG ATTGTACCGG CGACGCTGGC CGGGATACGC 
GCCACCTTTT GTGAAGAGAA GCATCGCAAC ATGGCGCTGG GCGTCTGGGC AGCGGTAGGT 
TCGGGCGGAG CGGCGTTTGG GCCGCTCATC GGCGGCATAT TATTAGAGCA TTTTTACTGG 
GGATCGGTTT TCCTGATCAA CGTGCCGATT GTGCTGGTCG TCATGGGCTT AACCGCCCGT 
TATGTTCCTC GCCAGGCGGG CCGTCGCGAT CAACCGCTCA ATCTTGGCCA TGCGGTGATG 
CTGATTATTG CCATTTTGCT GTTGGTCTAT AGCGCTAAAA CCGCGCTGAA AGGGCATCTG 
TCGCTGTGGG TCATCTCGCT TACCCTGCTT ACCGGCGCGT TGCTACTGGG ACTCTTTATC 
CGCACACAGC TTGCGACATC GCGTCCGATG ATTGATATGC GACTATTTAC CCATCGCATT 
ATCCTGAGCG GCGTCGTGAT GGCAATGACC GCGATGATCA CGCTGGTGGG TTTTGAGCTG 
CTGATGGCGC AAGAGCTGCA GTTTGTTCAC GGACTATCGC CTTATGAGGC CGGGGTATTT 
ATGCTGCCGG TGATGGTCGC CAGTGGATTC AGCGGGCCGA TTGCGGGCGT GCTGGTCTCG 
CGTCTGGGAC TACGGCTGGT CGCGACGGGC GGCATGGCGT TAAGCGCGCT GAGTTTTTAT 
GGCCTGGCGA TGACGGATTT CAGCACCCAA CAATGGCAGG CTTGGGGGCT GATGGCGCTG 
CTGGGATTTA GCGCCGCCAG CGCATTGCTG GCTTCCACGT CGGCAATTAT GGCCGCTGCG 
CCGGCAGAAA AAGCGGCGGC GGCCGGCGCG ATAGAAACGA TGGCTTATGA ACTGGGCGCG 
GGACTGGGCA TCGCCATTTT CGGTCTGTTG TTAAGCCGTA GCTTCTCCGC GTCTATCCGT 
CTGCCTGCCG GGCTTGAGGC GCAAGAGATT GCCAGAGCGT CATCTTCAAT GGGAGAAGCC 
GTGCAGTTGG CGAATAGCCT ACCGCCCACG CAGGGGCAGG CAATACTGGA CGCCGCCAGA 
CATGCCTTTA TCTGGTCGCA TAGCGTGGCG TTAAGCAGCG CCGGGAGTAT GCTTCTTTTG 
CTGGCGGTAG GGATGTGGTT CAGCCTGGCA AAAGCCCAAC GCCGATAA

Protein sequence

MFRQWLTLVI IVLVYIPVAI DATVLHVAAP TLSMTLGASG NELLWIIDIY SLVMAGMVLP 
MGALGDRIGF KRLLMLGGTL FGLASLAAAF SHTASWLIAT RVLLAIGAAM IVPATLAGIR 
ATFCEEKHRN MALGVWAAVG SGGAAFGPLI GGILLEHFYW GSVFLINVPI VLVVMGLTAR 
YVPRQAGRRD QPLNLGHAVM LIIAILLLVY SAKTALKGHL SLWVISLTLL TGALLLGLFI 
RTQLATSRPM IDMRLFTHRI ILSGVVMAMT AMITLVGFEL LMAQELQFVH GLSPYEAGVF 
MLPVMVASGF SGPIAGVLVS RLGLRLVATG GMALSALSFY GLAMTDFSTQ QWQAWGLMAL 
LGFSAASALL ASTSAIMAAA PAEKAAAAGA IETMAYELGA GLGIAIFGLL LSRSFSASIR 
LPAGLEAQEI ARASSSMGEA VQLANSLPPT QGQAILDAAR HAFIWSHSVA LSSAGSMLLL 
LAVGMWFSLA KAQRR