Gene SeAg_B2022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeAg_B2022
Symbol
ID	6793404
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Agona str. SL483
Kingdom	Bacteria
Replicon accession	NC_011149
Strand	+
Start bp	1961857
End bp	1963065
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	56%
IMG OID	642776246
Product	multidrug resistance protein MdtH
Protein accession	YP_002146877
Protein GI	197251455
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGCGCG TCTCGCAGGC GAGGAACCTG GGTAAATATT TTCTTCTCAT CGATAACATG 
TTGGTGGTGC TGGGTTTTTT CGTCGTCTTC CCGCTCATCT CTATTCGCTT TGTCGATCAA 
ATGGGGTGGG CTGCCGTAAT GGTAGGGATC GCGCTCGGCC TGCGCCAGTT TATTCAACAA 
GGTCTGGGCA TTTTTGGCGG CGCCATCGCC GATCGCTTTG GCGCGAAACC GATGATTGTC 
ACCGGTATGC TGATGCGCGC CGCAGGCTTT GCCACCATGG GTATCGCGCA TGAGCCCTGG 
CTCTTGTGGT TTTCCTGCTT TCTTTCCGGT CTCGGCGGTA CGCTTTTCGA CCCGCCGCGT 
TCAGCGCTGG TGGTCAAATT AATTCGTCCG GAGCAACGGG GCCGCTTCTT CTCTCTGTTG 
ATGATGCAGG ACAGCGCGGG CGCGGTGATT GGCGCGCTGC TGGGAAGCTG GTTGCTACAA 
TACGATTTTC GCCTGGTCTG CGCGACGGGC GCTATTTTGT TCATATTATG CGCCCTTTTC 
AATGCATGGC TGCTTCCGGC CTGGAAGCTA TCAACGGTCA GAACGCCGGT GCGTGAAGGA 
ATGCGCCGCG TCATGAGCGA TAAAAGGTTT GTCACCTACG TGCTGACGCT GGCGGGCTAC 
TATATGCTGG CGGTACAGGT CATGTTAATG CTGCCGATTA TGGTAAACGA TATCGCCGGT 
TCGCCTGCTG CCGTGAAATG GATGTACGCT ATTGAGGCGT GTCTCTCGCT GACGTTGCTC 
TACCCGATTG CCCGCTGGAG CGAAAAGCGT TTTCGGCTGG AGCATCGGCT GATGGCCGGT 
TTGCTCGTCA TGTCGCTGAG CATGCTCCCC ATCGGGATGG TGGGCAATTT ACAGCAGCTT 
TTTACGCTTA TTTGCGCTTT CTACATCGGC TCGGTTATCG CCGAACCGGC GCGCGAAACG 
CTCAGCGCGT CGCTCGCAGA CGCGAGGGCG CGGGGAAGCT ATATGGGCTT TAGCCGTCTG 
GGATTAGCCA TTGGCGGCGC GATTGGTTAT ATCGGCGGCG GCTGGTTGTT TGATATGGGT 
AAAGCGCTTG CGCAGCCTGA ACTACCGTGG ATGATGCTCG GTATTATCGG CTTTATCACC 
TTTTTGGCTT TAGGCTGGCA ATTTAGTCAT AAACGCACGC CGCGCCGGAT GCTGGAACCC 
GGCGCCTGA

Protein sequence

MSRVSQARNL GKYFLLIDNM LVVLGFFVVF PLISIRFVDQ MGWAAVMVGI ALGLRQFIQQ 
GLGIFGGAIA DRFGAKPMIV TGMLMRAAGF ATMGIAHEPW LLWFSCFLSG LGGTLFDPPR 
SALVVKLIRP EQRGRFFSLL MMQDSAGAVI GALLGSWLLQ YDFRLVCATG AILFILCALF 
NAWLLPAWKL STVRTPVREG MRRVMSDKRF VTYVLTLAGY YMLAVQVMLM LPIMVNDIAG 
SPAAVKWMYA IEACLSLTLL YPIARWSEKR FRLEHRLMAG LLVMSLSMLP IGMVGNLQQL 
FTLICAFYIG SVIAEPARET LSASLADARA RGSYMGFSRL GLAIGGAIGY IGGGWLFDMG 
KALAQPELPW MMLGIIGFIT FLALGWQFSH KRTPRRMLEP GA