Gene SeAg_B2231 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeAg_B2231
Symbol	wcaI
ID	6795412
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Agona str. SL483
Kingdom	Bacteria
Replicon accession	NC_011149
Strand	-
Start bp	2147806
End bp	2149029
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	57%
IMG OID	642776439
Product	putative glycosyl transferase
Protein accession	YP_002147064
Protein GI	197249537
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGATCC TGGTCTATGG CATTAACTAT TCACCGGAAC TGACCGGTAT CGGCAAATAT 
ACCGGCGAAA TGGTGGCGTG GATGGCGCGG GAAGGCCATG AGGTGCGGGT CATTACTGCG 
CCGCCGTACT ACCCGCAGTG GAAGGTCGGT GAGCGCTATT CCGCCTGGCG CTATCGCCGG 
GAAGAGGGCG AGGCTACCGT CTGGCGCTGC CCGCTGTATG TGCCGAAACA GCCCTCCACC 
CTAAAACGAC TGCTTCATCT GGGGAGCTTT GCATTGAGCA GTTTTTTCCC ACTGATGGCG 
CAGCGTCGCT GGAAGCCGGA TCGGATTATC GGCGTTGTAC CGACGCTCTT TTGTACGCCG 
GGAATGCGCC TGCTGGCGGC ACTCTCCGGC GCGCGTACCG TACTGCATAT TCAGGATTAC 
GAAGTGGATG CCATGCTCGG CTTAGGAATG GCGGGAAAAG GCAAGCGCGG CAGCGTAGCG 
CGGTTAGCGA CGGCCTTTGA ACGCAGCGCG CTGCGTAACG TTGATAATGT TTCGACCATT 
TCTCGCTCCA TGATGAATAA AGCGCGGGAA AAAGGCGTCG CGGCGGAAAA AATCCTCTTT 
TTTCCGAACT GGTCGGAAGT GGCGCGCTTT CAGGACGTTA ATGACGCTGA CGTGACGGCT 
TTGCGTCAGC AGCTTGGTTT GCCAGAGGGC AAAAAAATTG TGCTTTATTC CGGCAATATC 
GGCGAAAAGC AAGGGCTGGA AAAGGTGATT GACGCCGCGG AACGATTACG CGATCGACCA 
TTGATTTTTG CGATTGTCGG CCAGGGGGGC GGCAAGGCGC GGCTGGAGAA CATGGCCCGC 
GAACGCGGCC TGCCAAATAT TAAATTCCTC CCGCTGCAGC CTTACGACGC CTTACCCGCG 
CTGCTGAAAA TGGGCGACTG CCATCTGGTG GTGCAAAAGC GCGGCGCAGC GGATGCGGTA 
CTGCCCTCCA AGCTGACTAA CATTCTGGCG GTCGGCGGTA ATGCGGTGAT TACCGCTGAG 
CCGCACACCG AATTAGGACA ACTTTGCGCG CGCTATCCGG GCATCGCCGT TTGCGTGGAA 
CCGGAGTCGA CCGACGCGCT GGTTAACGGG ATTAGCCAGG CGCTCGCCAT GCCGAAAAAC 
AATACGACGG CACGTGAATA CGCCGAACGC ACGCTCAATA AAGAGAACGT GCTACGCCAA 
TTTATTGCAG ATATTCGGGG ATGA

Protein sequence

MKILVYGINY SPELTGIGKY TGEMVAWMAR EGHEVRVITA PPYYPQWKVG ERYSAWRYRR 
EEGEATVWRC PLYVPKQPST LKRLLHLGSF ALSSFFPLMA QRRWKPDRII GVVPTLFCTP 
GMRLLAALSG ARTVLHIQDY EVDAMLGLGM AGKGKRGSVA RLATAFERSA LRNVDNVSTI 
SRSMMNKARE KGVAAEKILF FPNWSEVARF QDVNDADVTA LRQQLGLPEG KKIVLYSGNI 
GEKQGLEKVI DAAERLRDRP LIFAIVGQGG GKARLENMAR ERGLPNIKFL PLQPYDALPA 
LLKMGDCHLV VQKRGAADAV LPSKLTNILA VGGNAVITAE PHTELGQLCA RYPGIAVCVE 
PESTDALVNG ISQALAMPKN NTTAREYAER TLNKENVLRQ FIADIRG