Gene SeD_A1049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A1049
Symbol	msbA
ID	6873596
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	1050408
End bp	1052156
Gene Length	1749 bp
Protein Length	582 aa
Translation table	11
GC content	52%
IMG OID	642784234
Product	lipid transporter ATP-binding/permease protein
Protein accession	YP_002214908
Protein GI	198244768
COG category	[V] Defense mechanisms
COG ID	[COG1132] ABC-type multidrug transport system, ATPase and permease components
TIGRFAM ID	[TIGR02203] lipid A export permease/ATP-binding protein MsbA

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	0.183717
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATAACG ATAAAGATCT CTCTACGTGG CAGACCTTCC GCCGACTGTG GCCAACCATA 
GCGCCTTTTA AAGCAGGTCT GATCGTGGCG GGCATAGCGT TAATTCTCAA CGCAGCCAGC 
GATACCTTCA TGCTATCGCT CCTCAAGCCA TTACTGGATG ATGGTTTCGG TAAAACGGAT 
CGCTCAGTGT TGCTGTGGAT GCCGCTGGTG GTTATTGGGC TGATGATATT ACGAGGCATC 
ACTAGCTATA TCTCCAGCTA CTGTATTTCA TGGGTGTCAG GCAAGGTGGT AATGACCATG 
CGCCGTCGCC TGTTTGGCCA TATGATGGGA ATGCCCGTCG CTTTCTTTGA TAAACAGTCT 
ACCGGTACGC TGCTGTCGCG TATTACATAC GATTCAGAAC AGGTTGCCTC TTCTTCATCT 
GGCGCGCTGA TTACCGTGGT GCGTGAAGGG GCATCGATCA TCGGATTGTT TATCATGATG 
TTCTATTACA GCTGGCAGCT GTCGATCATC CTGGTTGTTT TAGCGCCGAT TGTGTCGATT 
GCGATTCGCG TTGTCTCAAA GCGGTTCCGC AGCATCAGTA AAAATATGCA GAACACGATG 
GGACAAGTGA CTACCAGCGC TGAACAAATG CTGAAAGGAC ACAAAGAGGT ACTGATTTTT 
GGCGGTCAGG AAGTCGAAAC TAAACGCTTT GATAAAGTCA GCAATAAGAT GCGACTGCAA 
GGCATGAAAA TGGTCTCTGC CTCGTCAATT TCCGATCCTA TCATTCAGCT CATTGCCTCG 
CTGGCGCTGG CGTTTGTCCT CTATGCTGCG AGCTTCCCAA GCGTAATGGA TAGCCTGACG 
GCAGGGACCA TCACCGTGGT GTTCTCCTCC ATGATCGCGC TGATGCGTCC ATTAAAATCG 
CTGACAAACG TTAACGCGCA GTTCCAGCGT GGGATGGCGG CTTGTCAGAC GTTGTTTGCG 
ATTCTGGACA GCGAACAGGA GAAAGATGAA GGTAAACGTG TCATTGACCG CGCGACCGGC 
GATCTCGAAT TCCGCAATGT GACGTTTACT TACCCGGGCC GTGAAGTGCC GGCATTGCGT 
AACATCAATT TGAAAATTCC TGCCGGGAAA ACCGTGGCGC TGGTGGGGCG TTCCGGATCG 
GGTAAATCAA CTATCGCCAG TCTGATCACC CGTTTCTACG ATATTGATGA AGGACACATC 
CTGATGGATG GTCACGATCT ACGCGAATAC ACTCTGGCCT CTCTACGTAA TCAGGTGGCG 
CTGGTTTCGC AAAACGTGCA TCTGTTTAAC GACACGGTCG CCAATAACAT TGCTTATGCC 
CGGACGGAAG AATACAGCCG CGAGCAGATT GAAGAGGCGG CGCGCATGGC CTATGCCATG 
GACTTTATCA ATAAGATGGA TAATGGCCTG GATACCATCA TCGGCGAAAA CGGCGTACTG 
CTTTCCGGCG GTCAGCGCCA GCGTATCGCG ATCGCCCGCG CCTTACTGCG TGACAGCCCG 
ATTCTGATCC TTGATGAAGC TACGTCCGCG CTGGATACCG AATCTGAACG TGCGATTCAG 
GCAGCGTTGG ATGAGCTGCA GAAAAACCGT ACCTCTCTGG TGATTGCGCA CCGTCTCTCC 
ACCATCGAAC AGGCGGATGA GATCGTTGTA GTCGAAGACG GTATTATCGT TGAGCGCGGC 
ACTCATAGCG AGCTGCTGGC GCAACACGGC GTTTACGCCC AGCTACATAA GATGCAATTT 
GGCCAATGA

Protein sequence

MHNDKDLSTW QTFRRLWPTI APFKAGLIVA GIALILNAAS DTFMLSLLKP LLDDGFGKTD 
RSVLLWMPLV VIGLMILRGI TSYISSYCIS WVSGKVVMTM RRRLFGHMMG MPVAFFDKQS 
TGTLLSRITY DSEQVASSSS GALITVVREG ASIIGLFIMM FYYSWQLSII LVVLAPIVSI 
AIRVVSKRFR SISKNMQNTM GQVTTSAEQM LKGHKEVLIF GGQEVETKRF DKVSNKMRLQ 
GMKMVSASSI SDPIIQLIAS LALAFVLYAA SFPSVMDSLT AGTITVVFSS MIALMRPLKS 
LTNVNAQFQR GMAACQTLFA ILDSEQEKDE GKRVIDRATG DLEFRNVTFT YPGREVPALR 
NINLKIPAGK TVALVGRSGS GKSTIASLIT RFYDIDEGHI LMDGHDLREY TLASLRNQVA 
LVSQNVHLFN DTVANNIAYA RTEEYSREQI EEAARMAYAM DFINKMDNGL DTIIGENGVL 
LSGGQRQRIA IARALLRDSP ILILDEATSA LDTESERAIQ AALDELQKNR TSLVIAHRLS 
TIEQADEIVV VEDGIIVERG THSELLAQHG VYAQLHKMQF GQ