Gene SNSL254_A2288 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A2288
Symbol	wcaI
ID	6484612
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	2201349
End bp	2202572
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	58%
IMG OID	642737634
Product	putative glycosyl transferase
Protein accession	YP_002041376
Protein GI	194445091
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.907733
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	0.00856405
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAGATCC TGGTCTATGG CATTAACTAT TCGCCGGAAC TGACCGGTAT CGGCAAATAT 
ACCGGTGAAA TGGTGGCGTG GATGGCGCAG GAAGGCCATG AGGTGCGGGT CATTACTGCG 
CCGCCGTACT ACCCGCAGTG GAAGGTCGGC GAGCGCTATT CCGCCTGGCG CTATCGCCGG 
GAAGAGGGCG AGGCTACCGT CTGGCGTTGC CCGCTGTATG TGCCGAAACA GCCCTCCACC 
CTAAAACGAC TACTTCATCT GGGGAGCTTT GCATTGAGCA GTTTTTTCCC ACTGATGGCG 
CAGCGTCGCT GGAAGCCGGA TCGGATTATC GGCGTTGTAC CGACGCTCTT TTGTACGCCG 
GGAATGCGCC TGCTGGCGAC ACTCTCCGGC GCACGTACCG TTCTGCATAT TCAGGATTAC 
GAAGTGGACG CCATGCTCGG CTTAGGAATG GCGGGAAAAG GCAAGCGCGG CAGCGTAGCG 
CGGTTAGCGA CGGCCTTTGA ACGCAGCGCG CTGCGTAACG TTGATAATGT TTCGACCATT 
TCTCGCTCCA TGATGAATAA AGCGCGGGAA AAAGGCGTCG CGGCGGAAAA AATCCTCTTT 
TTTCCGAACT GGTCGGAAGT GGCGCGCTTT CAGGACGTTA ATGACGCTGA CGTGACGGCT 
TTGCGTCAGC AGCTTGGCTT GCCAGAGGGC AAAAAAATTG TGCTCTATTC CGGCAATATC 
GGCGAAAAGC AAGGGCTGGA AAAGGTAATT GACGCCGCGG AACGATTACG CGATCGACCG 
TTGATTTTTG CGATTGTCGG CCAGGGGGGC GGCAAGGCGC GGCTGGAGAA CATGGCCCGC 
GAACGCGGCC TGGCAAATAT TAAATTCCTC CCGCTGCAGC CTTACGACGC CTTACCCGCG 
CTGCTGAAAA TGGGCGACTG CCATCTGGTG GTGCAAAAGC GCGGCGCAGC GGATGCGGTA 
CTGCCCTCCA AGCTGACTAA CATTCTGGCG GTCGGCGGTA ATGCGGTGAT TACCGCTGAG 
CCGCACACCG AATTAGGACA ACTTTGCGCG CGCTATCCGG GCATCGCCGT TTGCGTGGAG 
CCGGAGTCGA CCGACGCGCT GGTCGACGGG ATTAGCCAGG CGCTCGCCAT GCCGAAAAAC 
AACACGACGG CACGTGAATA CGCCGAACGC ACGCTCAATA AAGAGAACGT GCTACGCCAA 
TTTATTGCAG ATATTCGGGG ATGA

Protein sequence

MKILVYGINY SPELTGIGKY TGEMVAWMAQ EGHEVRVITA PPYYPQWKVG ERYSAWRYRR 
EEGEATVWRC PLYVPKQPST LKRLLHLGSF ALSSFFPLMA QRRWKPDRII GVVPTLFCTP 
GMRLLATLSG ARTVLHIQDY EVDAMLGLGM AGKGKRGSVA RLATAFERSA LRNVDNVSTI 
SRSMMNKARE KGVAAEKILF FPNWSEVARF QDVNDADVTA LRQQLGLPEG KKIVLYSGNI 
GEKQGLEKVI DAAERLRDRP LIFAIVGQGG GKARLENMAR ERGLANIKFL PLQPYDALPA 
LLKMGDCHLV VQKRGAADAV LPSKLTNILA VGGNAVITAE PHTELGQLCA RYPGIAVCVE 
PESTDALVDG ISQALAMPKN NTTAREYAER TLNKENVLRQ FIADIRG