Gene SNSL254_A3993 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A3993
Symbol
ID	6486546
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	3880728
End bp	3881942
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	39%
IMG OID	642739253
Product	O-antigen ligase
Protein accession	YP_002042963
Protein GI	194443618
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3307] Lipid A core - O-antigen ligase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	67
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTAACCA CATCATTAAC GTTAAATAAA GAGAAATGGA AACCGATCTG GAATAAAGCG 
CTGGTTTTTC TTTTTGTTGC CACGTATTTT CTGGATGGTA TTACGCGTTA TAAACATTTG 
ATAATCATAC TTATGGTTAT CACCGCGATT TATCAGGTCT CACGCTCACC GAAAAGTTTC 
CCCCCTCTTT TCAAAAATAG CATATTTTAT AGCGTAGCAG TATTATCATT AATCCTTGTT 
TATTCCATAC TCATATCGCC AGATATGAAA GAAAGCTTCA AGGAATTTGA AAATACGGTA 
CTGGAGGGTT TCTTATTATA TACTTTATTA ATTCCCGTAC TATTAAAAGA TGAAACAAAA 
GAAACGGTTG CGAAAGTAGT ACTTTTCTCC TTTTTAACAA GTTTAGGACT TCGCTGCCTT 
GCAGAGAGTA TTCTATATAT CGAGGACTAT AATAAAGGGA TTATGCCATT CATGAGCTAT 
GCGCATCGAC ATATGTCCGA TTCCATGGTT TTCTTATTTC CAGCATTATT GAATATTTGG 
CTGTTTAGAA AAAATGCACT TAAGTTGGTT TTTTTGGTGC TTAGCGCTAT CTATCTTTTC 
TTTATCCTGG GAACCCTATC GCGAGGGGCA TGGTTGGCGG TGCTCATAGT AGGTGCGCTG 
TGGGCAATAC TGAATCGCCA ATGGAAGTTA ATAGGAGTCG GTGCCATTTT ATTAGCCATC 
ATCGGCGCTT TGGTTATCAC TCAACATAAT AACCAATCAG ATTCAGAACA TTTACTTTAT 
AAATTACAGC AGACAGATAG CTCATCTCGT TATACTAACG GAACCCAGGG CACCGCGTGG 
ATACTGATTC AGGAAAACCC GATCAAGGGC TACGGCTATG GTAATGATGT GTATGATGGT 
GTTTATAATA AACGCGTTGT CGATTATCCA ACGTGGACCT TTAAAGAATC TATCGGTCCG 
CATAATACCA TTCTGTACAT CTGGTTTAGT GCAGGCATAT TAGGTCTGGC GAGCTTGGCC 
TATTTATATG GCGCTATCAT CAGGGAAACA GCCAGCTCTA CCTTCAGGAA AGTAGAGATA 
AGTCCCTACA ATGCTCATCT CTTGCTATTT TTATCTTTCG TCGGTTTTTA TATCGTTCGT 
GGCAATTTTG AACAGGTCGA TATTGCTCAA ACTGGTATCA TTACTGGTTT TCTGCTGGCG 
CTAAGAAATA GATAA

Protein sequence

MLTTSLTLNK EKWKPIWNKA LVFLFVATYF LDGITRYKHL IIILMVITAI YQVSRSPKSF 
PPLFKNSIFY SVAVLSLILV YSILISPDMK ESFKEFENTV LEGFLLYTLL IPVLLKDETK 
ETVAKVVLFS FLTSLGLRCL AESILYIEDY NKGIMPFMSY AHRHMSDSMV FLFPALLNIW 
LFRKNALKLV FLVLSAIYLF FILGTLSRGA WLAVLIVGAL WAILNRQWKL IGVGAILLAI 
IGALVITQHN NQSDSEHLLY KLQQTDSSSR YTNGTQGTAW ILIQENPIKG YGYGNDVYDG 
VYNKRVVDYP TWTFKESIGP HNTILYIWFS AGILGLASLA YLYGAIIRET ASSTFRKVEI 
SPYNAHLLLF LSFVGFYIVR GNFEQVDIAQ TGIITGFLLA LRNR