Gene SNSL254_A3014 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A3014
Symbol	emrA
ID	6485332
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	2938419
End bp	2939591
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	54%
IMG OID	642738330
Product	multidrug resistance protein A
Protein accession	YP_002042059
Protein GI	194445068
COG category	[V] Defense mechanisms
COG ID	[COG1566] Multidrug resistance efflux pump
TIGRFAM ID	[TIGR00998] efflux pump membrane protein (multidrug resistance protein A)

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	0.00193784
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCTCAA ATGCGGAGAT CCAAACCCCG CAGCAACCGG CTAAGAAGAA AGGCAAACGC 
AAAACAGCGC TGCTACTTCT TACCTTGCTC TTTGTTATTA TTGCCGTGGC ATATGGAATT 
TATTGGTTTT TAGTATTGCG TCATATTGAA GAGACAGATG ATGCTTACGT GGCAGGGAAC 
CAGGTTCAAA TCATGGCGCA GGTGTCAGGC AGCGTGACGA AAGTCTGGGC TGATAACACC 
GACTTTGTAA AAGAGGGCGA TGTTCTGGTC ACGCTCGATC AGACTGACGC CAAACAAGCG 
TTTGAAAGAG CCAAAACGGC GCTGGCCTCC AGCGTGCGCC AGACGCACCA GTTGATGATT 
AACAGCAAGC AGTTGCAGGC GAATATCGAC GTGCAAAAAA CCGCCCTGGC GCAAGCGCAA 
AGCGACCTTA ACCGTCGTGT GCCGCTGGGT AATGCCAATC TTATTGGCCG TGAAGAGCTG 
CAACACGCCC GCGATGCCGT CGCCAGCGCG CAGGCACAGC TGGATGTCGC CATTCAACAG 
TACAATGCCA ACCAGGCAAT GATACTCAAC AGTAATCTGG AAGATCAGCC TGCGGTTCAA 
CAAGCGGCGA CCGAAGTGCG TAACGCCTGG CTGGCGCTGG AGCGTACCCG CATCGTCAGC 
CCAATGACTG GTTATGTCTC CCGCCGCGCC GTCCAGCCTG GCGCGCAAAT CAGCCCCACC 
ACGCCGCTGA TGGCCGTGGT GCCTGCAACC GATCTGTGGG TGGACGCTAA CTTTAAAGAA 
ACCCAATTAG CGAATATGCG CATTGGGCAG CCAGTGACGG TGATTACTGA TATTTATGGC 
GACGACGTAA AATACACCGG TAAAGTCGTC GGTCTGGATA TGGGAACAGG CAGCGCCTTC 
TCCCTGCTGC CCGCGCAAAA TGCGACGGGT AACTGGATTA AAGTGGTTCA ACGTCTGCCG 
GTACGCGTCG AACTGGACGC CCGCCAGTTA GAACAACATC CGCTGCGTAT TGGTTTATCG 
ACGCTGGTCA CCGTGGATAC CGCTAATCGC GACGGTCAGG TACTGGCCAG CCAGGTACGA 
ACGACGCCGG TTGCCGAAAG TAACGCACGC GAAATTAATC TCGCGCCGGT CAATAAACTG 
ATCGACGACA TCGTACAGGC TAACGCGGGT TAA

Protein sequence

MSSNAEIQTP QQPAKKKGKR KTALLLLTLL FVIIAVAYGI YWFLVLRHIE ETDDAYVAGN 
QVQIMAQVSG SVTKVWADNT DFVKEGDVLV TLDQTDAKQA FERAKTALAS SVRQTHQLMI 
NSKQLQANID VQKTALAQAQ SDLNRRVPLG NANLIGREEL QHARDAVASA QAQLDVAIQQ 
YNANQAMILN SNLEDQPAVQ QAATEVRNAW LALERTRIVS PMTGYVSRRA VQPGAQISPT 
TPLMAVVPAT DLWVDANFKE TQLANMRIGQ PVTVITDIYG DDVKYTGKVV GLDMGTGSAF 
SLLPAQNATG NWIKVVQRLP VRVELDARQL EQHPLRIGLS TLVTVDTANR DGQVLASQVR 
TTPVAESNAR EINLAPVNKL IDDIVQANAG