Gene SeD_A2458 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A2458
Symbol
ID	6874455
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	2333134
End bp	2334273
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	54%
IMG OID	642785547
Product	polysaccharide biosynthesis/export protein
Protein accession	YP_002216205
Protein GI	198242572
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1596] Periplasmic protein involved in polysaccharide export
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	0.0550214
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGAAAT CCAAAATGAA ATTGATGCCA TTATTGGCGT CGCTCAGCTT GATAAGTGGT 
TGCACAGTAC TTCCGGGCAG CAATATGTCT ACGATGGGGA AAGATGTGAT CAAACAGCAA 
GACGCTGACT TTGATCTCGA CCGGATGGTC AATGTGTATC CGCTGACGCC ACGGCTGGTT 
GAGCAATTAC GCCCGCGGCC CAATGTCGCG CAACCGAATA TGTCGCTGGA CCAGGAGATC 
GCCAGCTATC AGTATCGCGT CGGGCCTGGC GATGTGCTGA ATGTCACCGT CTGGGATCAC 
CCGGAATTGA CCACGCCAGC GGGCCAGTAC CGTAGCTCAA GCGATACCGG CAACTGGGTA 
CAGCCGGACG GCACCATGTT TTATCCCTAC ATTGGCAAGG TTAGCGTCGT CGGTAAAACT 
TTGTCAGAGA TTCGCAGCGA TATTACCGGG CGTTTAGCGA AGTACATCGC GGACCCGCAG 
GTGGATGTCA ATATCGCCGC TTTCCGCTCG CAAAAAGCGT ATATCTCCGG CCAGGTGAAT 
AAATCCGGTC AGCAGGCCAT TACTAACGTA CCGCTAACCG TCCTGGATGC GATTAACGCC 
GCGGGCGGCC TGACCGATAT GGCGGACTGG CGCAACGTCG TGTTGACGCA CAACGGCAAA 
GAACAGCGCA TTTCGCTACA GGCGCTGATG CAAAATGGCG ATCTTAGTCA GAACCGCTTG 
CTCTACCCTG GCGACATTCT GTATGTGCCG CGCAATGACG ATCTGAAAGT CTTTGTCATG 
GGCGAAGTGA AAAAACAGAG CACCCTCAAA ATGGATTTCA GCGGCATGAC GCTCACCGAA 
GCATTGGGCA ATGCGGAAGG CATCGATCTG ACCACCTCCA ACGCCAGCGG CATTTTTGTG 
ATTCGTCCGT TGAAAGGCGA GGGGGAACGC GGCGGCAAGA TCGCCAATAT CTACCAGCTT 
GATATGTCTG ACGCCACGTC ATTGGTGATG GCGACGGAAT TCCGACTTCA GCCTTACGAT 
GTGGTGTACG TCACGACCGC GCCGGTTGCT CGCTGGAACC GTCTGATCAA TCAGTTGCTG 
CCAACCATTA GCGGTGTCCG TTATATGACG GATACGGCCA GCGACATTCA TTCCTGGTAA

Protein sequence

MMKSKMKLMP LLASLSLISG CTVLPGSNMS TMGKDVIKQQ DADFDLDRMV NVYPLTPRLV 
EQLRPRPNVA QPNMSLDQEI ASYQYRVGPG DVLNVTVWDH PELTTPAGQY RSSSDTGNWV 
QPDGTMFYPY IGKVSVVGKT LSEIRSDITG RLAKYIADPQ VDVNIAAFRS QKAYISGQVN 
KSGQQAITNV PLTVLDAINA AGGLTDMADW RNVVLTHNGK EQRISLQALM QNGDLSQNRL 
LYPGDILYVP RNDDLKVFVM GEVKKQSTLK MDFSGMTLTE ALGNAEGIDL TTSNASGIFV 
IRPLKGEGER GGKIANIYQL DMSDATSLVM ATEFRLQPYD VVYVTTAPVA RWNRLINQLL 
PTISGVRYMT DTASDIHSW