Gene SeD_A1359 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A1359
Symbol	msbB
ID	6872257
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	1334404
End bp	1335375
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	53%
IMG OID	642784527
Product	lipid A biosynthesis (KDO)2-(lauroyl)-lipid IVA acyltransferase
Protein accession	YP_002215197
Protein GI	198243024
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1560] Lauroyl/myristoyl acyltransferase
TIGRFAM ID	[TIGR02208] lipid A biosynthesis (KDO)2-(lauroyl)-lipid IVA acyltransferase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	0.00203152
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGAAACCA AAAAAAATAA TAGTGAGTAT ATCCCTGAAT TCGAAAAATC CTTTCGCTAT 
CCGCAGTATT GGGGCGCCTG GTTGGGCGCT GCGGCAATGG CGGGGATCGC ATTAACACCG 
GCATCATTCC GTGACCCTTT GCTGGCGACA CTGGGGCGCT TTGCCGGACG GCTGGGGAAG 
AGTTCTCGTC GCCGGGCGCT AATTAATCTG TCTTTGTGCT TTCCGCAGCG TAGCGAAGCT 
GAGCGCGAAG CGATTGTCGA TGAGATGTTC GCCACCGCGC CGCAGGCAAT GGCGATGATG 
GCTGAGTTGG CGATGCGCGG TCCGAAAAAA ATCCAACAGC GTGTTGACTG GGAAGGTCTG 
GAAATCATTG AGGAGATGCG TCGTAACGAC GAAAAAGTCA TTTTTCTCGT ACCGCATGGC 
TGGGGCGTCG ACATTCCGGC CATGCTGATG GCCTCTCAGG GGCAAAAAAT GGCGGCGATG 
TTTCATAATC AGGGTAATCC GGTTTTTGAC TATATCTGGA ACACAGTGCG TCGGCGTTTT 
GGCGGACGTT TGCATGCGCG TAATGACGGG ATTAAACCCT TTATTCAGTC TGTTCGTCAG 
GGCTACTGGG GCTACTACCT GCCGGACCAG GATCACGGCC CGGAGCATAG TGAATTCGTT 
GATTTCTTTG CGACATACAA AGCGACGCTG CCTGCGATTG GTCGGCTGAT GAAAGTATGC 
CGCGCACGCG TGATACCGCT TTTCCCGGTG TATAATGGTA AAACGCATCG CCTGACTATC 
CAGATTCGCC CGCCAATGGA CGATCTGCTC ACGGCTGACG ATCACACAAT CGCCAGACGG 
ATGAACGAAG AGGTCGAAAT TTTTGTCGGC CCGCATCCGG AACAGTACAC CTGGATCCTG 
AAGCTGCTCA AAACCCGCAA GCCAGGCGAG ATTCAGCCGT ATAAGCGTAA AGATCTTTAT 
CCCATCAAAT AA

Protein sequence

METKKNNSEY IPEFEKSFRY PQYWGAWLGA AAMAGIALTP ASFRDPLLAT LGRFAGRLGK 
SSRRRALINL SLCFPQRSEA EREAIVDEMF ATAPQAMAMM AELAMRGPKK IQQRVDWEGL 
EIIEEMRRND EKVIFLVPHG WGVDIPAMLM ASQGQKMAAM FHNQGNPVFD YIWNTVRRRF 
GGRLHARNDG IKPFIQSVRQ GYWGYYLPDQ DHGPEHSEFV DFFATYKATL PAIGRLMKVC 
RARVIPLFPV YNGKTHRLTI QIRPPMDDLL TADDHTIARR MNEEVEIFVG PHPEQYTWIL 
KLLKTRKPGE IQPYKRKDLY PIK