Gene SNSL254_A2300 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A2300
Symbol
ID	6485556
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	2212921
End bp	2213967
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	55%
IMG OID	642737646
Product	polysaccharide biosynthesis/export protein
Protein accession	YP_002041388
Protein GI	194446455
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1596] Periplasmic protein involved in polysaccharide export
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.631767
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	63
Fosmid unclonability p-value	0.480899
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGAAAG ATGTGATCAA ACAGCAAGAC GCTGACTTTG ATCTCGACCG GATGGTCAAT 
GTGTATCCGC TGACGCCACG GTTGGTTGAG CAATTACGCC CGCGGCCCAA TGTCGCGCAA 
CCGAATATGT CGCTGGACCA GGAGATCGCC AGCTATCAGT ATCGCGTCGG GCCTGGCGAT 
GTGCTGAATG TCACCGTCTG GGATCACCCG GAATTGACCA CGCCAGCAGG CCAGTACCGT 
AGCTCAAGCG ATACCGGCAA CTGGGTACAG CCGGACGGCA CCATGTTTTA TCCCTACATT 
GGCAAGGTTA GCGTCGTCGG TAAAACTTTG TCAGAGATTC GTAGCGATAT TACCGGGCGT 
TTAGCGAAGT ACATTGCGGA CCCGCAGGTG GATGTCAATA TCGCCGCTTT CCGCTCGCAA 
AAAGCGTACA TCTCCGGCCA GGTGAATAAA TCCGGTCAGC AGGCTATTAC TAACGTACCG 
CTAACCGTCC TGGATGCGAT TAACGCTGCG GGCGGCCTGA CCGATATGGC GGACTGGCGC 
AACGTCGTGT TGACGCACAA CGGCAAAGAA CAGCGCATTT CGCTACAGGC GCTGATGCAA 
AATGGCGATC TTAGCCAGAA CCGCTTGCTC TACCCTGGCG ACATTCTGTA TGTGCCGCGC 
AATGACGATC TGAAAGTCTT TGTCATGGGC GAAGTGAAAA AACAGAGCAC CCTCAAAATG 
GATTTCAGCG GCATGACGCT CACCGAAGCA TTAGGCAATG CGGAAGGCAT TGATCTGACC 
ACCTCCAACG CCAGCGGCAT TTTTGTGATT CGTCCGTTGA AAGGCGAGGG GGGACGCGGC 
GGCAAGATCG CCAATATCTA CCAGCTTGAT ATGTCTGACG CCACGTCATT GGTGATGGCG 
ACGGAATTCC GACTTCAGCC TTACGATGTG GTGTACGTCA CGACCGCGCC GGTTGCTCGC 
TGGAACCGTC TGATCAATCA GTTGCTGCCA ACCATTAGCG GTGTCCGTTA TATGACGGAT 
ACGGCCAGCG ACATTCATTC CTGGTAA

Protein sequence

MGKDVIKQQD ADFDLDRMVN VYPLTPRLVE QLRPRPNVAQ PNMSLDQEIA SYQYRVGPGD 
VLNVTVWDHP ELTTPAGQYR SSSDTGNWVQ PDGTMFYPYI GKVSVVGKTL SEIRSDITGR 
LAKYIADPQV DVNIAAFRSQ KAYISGQVNK SGQQAITNVP LTVLDAINAA GGLTDMADWR 
NVVLTHNGKE QRISLQALMQ NGDLSQNRLL YPGDILYVPR NDDLKVFVMG EVKKQSTLKM 
DFSGMTLTEA LGNAEGIDLT TSNASGIFVI RPLKGEGGRG GKIANIYQLD MSDATSLVMA 
TEFRLQPYDV VYVTTAPVAR WNRLINQLLP TISGVRYMTD TASDIHSW