Gene SeSA_A2333 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A2333
Symbol
ID	6515316
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	-
Start bp	2202985
End bp	2204205
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	57%
IMG OID	642747396
Product	putative colanic acid biosynthesis glycosyltransferase WcaL
Protein accession	YP_002115189
Protein GI	194735345
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.68197
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGTCA GCTTTTTTCT GCTGAAATTT CCACTCTCAT CGGAAACCTT TGTGCTGAAT 
CAGATTACTG CGTTTGTTGA TATGGGCCAT GAGGTGGAGA TTGTCGCGTT ACAAAAAGGC 
GATACCCAAC ATACTCACGC CGCCTGGGAG AAGTATGGCC TGGCGGCGAA AACCCGCTGG 
TTACAGGATG AGCCCCAGGG ACGGCTGGCG AAACTGCGCT ACCGGGCATG TAAAACGCTG 
CCGGGGCTGC ATCGTGCGGT GACCTGGAAA GCGCTCAATT TTATCCGCTA TGGCGATGAA 
TCACGCAATT TGATCCTTTC CGCGATTTGC GCGCAGGTGA GCCACCCTTT TGTGGCGGAT 
GTGTTTATCG CGCACTTTGG TCCGGCGGGC GTGACGGCGG CCAAACTACG CGAACTGGGC 
GTGCTTCGCG GCAAAATCGC GACTATTTTC CACGGGATTG ATATTTCCAG CCGCGAAGTG 
CTCAGTCATT ACACGCCGGA GTATCAGCAG TTGTTTCGTC GTGGCGATCT GATGCTGCCC 
ATCAGCGATC TGTGGGCCGG TCGCCTGAAA AGTATGGGCT GCCCGCCGGA AAAGATTGCC 
GTTTCGCGCA TGGGCGTCGA CATGACGCGT TTTTCCCATC GTCCGGTGAA AGCGCCAGGG 
ATGCCGCTGG AGATGATTTC CGTCGCGCGC CTGACCGAGA AAAAAGGACT GCATGTGGCG 
ATTGAAGCCT GTCGGCAACT GAAAGCGCAG GGCGTGGCGT TTCGCTACCG CATTCTGGGG 
ATTGGCCCGT GGGAACGTCG GCTGCGCACG CTCATCGAGC AGTATCAGTT AGAGGATGTC 
ATTGAGATGC CGGGGTTTAA ACCGAGCCAT GAAGTGAAGG CGATGCTGGA TGACGCCGAT 
GTTTTTTTGC TGCCGTCGAT TACCGGTACG GATGGCGATA TGGAAGGTAT TCCGGTAGCG 
CTGATGGAGG CGATGGCGGT GGGGATTCCC GTGGTGTCTA CCGTGCATAG CGGCATTCCG 
GAACTGGTGG AGGCCGGCAA ATCCGGCTGG CTGGTGCCGG AAAACGATGC GCAGGCGCTG 
GCGGCCCGAC TCGCTGAGTT CAGCCGGATT GACCACGACA CGCTGGAGTC GGTGATCACG 
CGCGCCCGTG AAAAAGTGGC GCAAGATTTT AACCAGCAGG TGATTAATCG CCAGTTAGCC 
AGCCTGCTAC AAACGATATA A

Protein sequence

MKVSFFLLKF PLSSETFVLN QITAFVDMGH EVEIVALQKG DTQHTHAAWE KYGLAAKTRW 
LQDEPQGRLA KLRYRACKTL PGLHRAVTWK ALNFIRYGDE SRNLILSAIC AQVSHPFVAD 
VFIAHFGPAG VTAAKLRELG VLRGKIATIF HGIDISSREV LSHYTPEYQQ LFRRGDLMLP 
ISDLWAGRLK SMGCPPEKIA VSRMGVDMTR FSHRPVKAPG MPLEMISVAR LTEKKGLHVA 
IEACRQLKAQ GVAFRYRILG IGPWERRLRT LIEQYQLEDV IEMPGFKPSH EVKAMLDDAD 
VFLLPSITGT DGDMEGIPVA LMEAMAVGIP VVSTVHSGIP ELVEAGKSGW LVPENDAQAL 
AARLAEFSRI DHDTLESVIT RAREKVAQDF NQQVINRQLA SLLQTI