Gene SNSL254_A4207 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A4207
Symbol	wecF
ID	6486863
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	4102352
End bp	4103431
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	54%
IMG OID	642739461
Product	4-alpha-L-fucosyltransferase
Protein accession	YP_002043164
Protein GI	194443274
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	87
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGTAC TGATTCACGT CCTGGGATCG GATATCCCTC ACCATAACCA CACCGTGCTG 
CGGTTTTTCA ATGATACGCT GGCCGCCACA AGCGAGCACG CGCGCGAATT TATGGTTGCC 
GGTGAAGATA ACGGCTTCAC GGAAAGCTGC CCGGCGCTCT CGCTTCGTTT TTATGGCAGT 
AAGAAAGCGC TGGCGCAGGC GGTCATCGCC AAAGCGAAAG CAAATCGTCG ACAGAGATTC 
TTCTTTCACG GTCAGTTCAA CACCAGCCTG TGGCTGGCGC TGTTAAGCGG CGGTATTAAG 
CCAGCTCAGT TTTACTGGCA TATCTGGGGC GCGGATCTCT ACGAAGTGTC CAACGGGCTG 
AAATTCCGCC TTTTCTACCC GCTTCGTCGT ATCGCGCAGG GGCGAGTAGG GTGCGTATTC 
GCGACGCGCG GCGATCTCAG CTATTTTGCG CGCCAGCATC CGGACGTACG CGGCGAGTTG 
CTCTATTTCC CGACGCGCAT GGATCCTTCC CTGAATGCTA TGGCAAAAGA GTGCCAACGT 
GCGGGAAAAT TGACCATTTT AGTAGGGAAC TCCGGCGATC GCAGTAACCA ACATATTGCG 
GCGTTACGGG CGGTGTATCA GCAGTTTGGC GACACGGTAA ACGTGGTGGT GCCGATGGGC 
TATCCGGCCA ATAACCAGGA CTATATTGAT GAGGTTCGTC AGGCCGGTCT GGCGCTATTT 
AGCGCCGAAA ATTTACAAAT TCTTAGCGAA AAAATGGAAT TTGATGCCTA TCTTGCGCTG 
TTGCGCCAGT GCGACCTCGG TTATTTTATT TTTGCCCGCC AACAGGGGAT CGGGACGTTA 
TGTCTGCTAA TTCAGGCCGA TATCCCGTGC GTACTGAATC GCGACAATCC TTTCTGGCAG 
GATATGGCGG AACAGCATCT GCCCGTCCTG TTTACCACGG ACGATCTTAA TGAGCAGGTC 
GTGCGCGAGG CGCAGCGTCA GCTCGCATCG GTAGATAAAA GCGGCATCAC CTTCTTTAGC 
CCCAACTACC TGCAACCGTG GCATAATGCG TTGAGAATCG CCGCAGGAGA AGCCGAATGA

Protein sequence

MTVLIHVLGS DIPHHNHTVL RFFNDTLAAT SEHAREFMVA GEDNGFTESC PALSLRFYGS 
KKALAQAVIA KAKANRRQRF FFHGQFNTSL WLALLSGGIK PAQFYWHIWG ADLYEVSNGL 
KFRLFYPLRR IAQGRVGCVF ATRGDLSYFA RQHPDVRGEL LYFPTRMDPS LNAMAKECQR 
AGKLTILVGN SGDRSNQHIA ALRAVYQQFG DTVNVVVPMG YPANNQDYID EVRQAGLALF 
SAENLQILSE KMEFDAYLAL LRQCDLGYFI FARQQGIGTL CLLIQADIPC VLNRDNPFWQ 
DMAEQHLPVL FTTDDLNEQV VREAQRQLAS VDKSGITFFS PNYLQPWHNA LRIAAGEAE