Gene SeD_A2440 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A2440
Symbol
ID	6872234
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	2313095
End bp	2314315
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	57%
IMG OID	642785529
Product	putative colanic acid biosynthesis glycosyltransferase WcaL
Protein accession	YP_002216187
Protein GI	198243356
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.0000788378
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAAGTCA GCTTTTTTCT GCTGAAATTT CCACTCTCAT CGGAAACCTT TGTGCTGAAT 
CAGATTACTG CGTTTATTGA TATGGGCCAT GAGGTGGAGA TTGTCGCGTT ACAAAAAGGC 
GATACCCAAC ATACTCACGC CGCCTGGGAG AAGTATGGCC TGGCGGCGAA AACCCGCTGG 
TTACAGGATG AGCCCCAGGG ACGGCTGGCG AAACTGCGCT ACCGGGCATG TAAAACGCTG 
CCGGGGCTGC ATCGGGCGGC GACCTGGAAA GCGCTCAATT TTACCCGCTA TGGCGATGAA 
TCACGCAATT TGATCCTTTC CGCGATTTGC GCGCAGGTGA GCCAGCCTTT TGGGGCGGAT 
GTGTTCATCG CACACTTTGG TCCGGCGGGC GTGACGGCGG CCAAACTACG CGAACTGGGC 
GTGCTTCGCG GCAAAATCGC GACTATTTTC CACGGGATTG ATATTTCCAG CCGCGAAGTG 
CTCAGTCATT ACACGCCGGA GTATCAGCAG TTGTTTCGTC GTGGCGATCT GATGCTGCCC 
ATCAGCGAAC TGTGGGCCGG TCGCCTGAAA AGTATGGGCT GTCCGCCGGA AAAGATTGCC 
GTTTCGCGCA TGGGCGTCGA CATGACGCGT TTTACCCATC GTCCGGTGAA AGCGCCAGGG 
ATGCCGCTGG AGATGATTTC CGTCGCGCGC CTGACTGAGA AAAAAGGCCT GCATGTGGCG 
ATTGAAGCCT GTCGGCAACT GAAAGCGCAG GGCGTGGCGT TTCGCTACCG CATTCTGGGC 
ATTGGCCCGT GGGAACGTCG GCTGCGCACG CTCATCGAGC AGTATCAGCT AGAGGATGTC 
ATTGAGATGC CGGGGTTTAA ACCGAGCCAT GAAGTGAAGG CGATGCTGGA TGACGCCGAT 
GTTTTTTTGC TGCCGTCGAT TACCGGTACG GATGGCGATA TGGAAGGTAT TCCGGTAGCG 
CTGATGGAGG CGATGGCGGT AGGGATTCCC GTGGTATCTA CCGTGCATAG CGGTATTCCG 
GAACTGGTGG AGGCCGGCAA ATCCGGCTGG CTGGTGCCGG AAAACGATGC GCAGGCGCTG 
GCGGCCCGAC TCGCTGAGTT CAGCCGGATT GACCACGACA CGCTGGAGTC GGTGATCACG 
CGCGCCCGTG AAAAAGTGGC GCAAGATTTT AATCAGCAGG CGATTAATCG CCAGCTAGCC 
AGCCTGCTAC AAACGATATA A

Protein sequence

MKVSFFLLKF PLSSETFVLN QITAFIDMGH EVEIVALQKG DTQHTHAAWE KYGLAAKTRW 
LQDEPQGRLA KLRYRACKTL PGLHRAATWK ALNFTRYGDE SRNLILSAIC AQVSQPFGAD 
VFIAHFGPAG VTAAKLRELG VLRGKIATIF HGIDISSREV LSHYTPEYQQ LFRRGDLMLP 
ISELWAGRLK SMGCPPEKIA VSRMGVDMTR FTHRPVKAPG MPLEMISVAR LTEKKGLHVA 
IEACRQLKAQ GVAFRYRILG IGPWERRLRT LIEQYQLEDV IEMPGFKPSH EVKAMLDDAD 
VFLLPSITGT DGDMEGIPVA LMEAMAVGIP VVSTVHSGIP ELVEAGKSGW LVPENDAQAL 
AARLAEFSRI DHDTLESVIT RAREKVAQDF NQQAINRQLA SLLQTI