Gene SeAg_B3931 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeAg_B3931
Symbol
ID	6793104
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Agona str. SL483
Kingdom	Bacteria
Replicon accession	NC_011149
Strand	+
Start bp	3827660
End bp	3828874
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	38%
IMG OID	642778051
Product	O-antigen ligase
Protein accession	YP_002148646
Protein GI	197251849
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3307] Lipid A core - O-antigen ligase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTAACCA CATCATTAAC GTTAAATAAA GAGAAATGGA AACCGATCTG GAATAAAGCG 
CTGGTTTTTC TTTTTGTTGC CACGTATTTT CTGGATGGTA TTACGCGTTA TAAACATTTG 
ATAATCATAC TTATGGTTAT CACCGCGATT TATCAGGTCT CACGCTCACC GAAAAGTTTC 
CCCCCTCTTT TCAAAAATAG CGTATTTTAT AGCGTAGCAG TATTATCATT AATCCTTGTT 
TATTCCATAC TCATATCGCC AGATATGAAA GAAAGTTTCA AGGAATTTGA AAATACGGTA 
CTGGAGGGTT TCTTATTATA TACTTTATTA ATTCCCGTAC TATTAAAAGA TGAAACAAAA 
GAAACGGTTG CGAAAATAGT ACTTTTCTCC TTTTTAACAA GTTTAGGGCT TCGCTGCCTT 
GCAGAGAGTA TTCTATATAT CGAGGACTAT AATAAAGGGA TTATGCCATT CATAAGCTAT 
GCGCATCGAC ATATGTCCGA TTCCATGGTT TTCTTATTTC CAGCATTATT GAATATTTGG 
CTGTTTAGAA AAAATGCAAT TAAGTTGGTT TTTTTGGTGC TTAGCGCTAT CTACCTTTTC 
TTTATCCTGG GAACCCTATC GCGAGGGGCA TGGTTGGCGG TGCTCATAGT AGGTGTTCTG 
TGGGCAATAC TGAACCGCCA ATGGAAGTTA ATAGGAGTTG GTGCCATTTT ATTAGCCATT 
ATCGGCGCTT TGGTTATCAC TCAACATAAT AACAAACCAG ACCCAGAACA TTTACTTTAT 
AAATTACAGC AGACAGATAG CTCATATCGT TATACTAACG GAACCCAGGG CACCGCGTGG 
ATACTAATTC AGGAAAACCC GATCAAGGGC TACGGCTATG GTAATGATGT GTATGATAGT 
GTTTATAATA AACGCGTTGT CGATTATCCA ACGTGGACCT TTAAAGAATC TATCGGTCCG 
CATAATACCA TCCTGTACAT CTGGTTTAGT GCTGGCATAT TAGGTCTGGC GAGCCTGGTC 
TATTTATATG GTGCTATCAT CAGAGAAACA GCCAGCTCTA CCTTCAGGAA AGTAGAGATA 
AGCCCCTACA ATGCTCATCT CTTGCTATTT TTATCTTTCG TCGGTTTTTA TATCGTTCGT 
GGCAATTTTG AACAGGTCGA TATTGCTCAA ATTGGTATCA TTACTGGTTT TCTACTGGCG 
CTAAGAAATA GATAA

Protein sequence

MLTTSLTLNK EKWKPIWNKA LVFLFVATYF LDGITRYKHL IIILMVITAI YQVSRSPKSF 
PPLFKNSVFY SVAVLSLILV YSILISPDMK ESFKEFENTV LEGFLLYTLL IPVLLKDETK 
ETVAKIVLFS FLTSLGLRCL AESILYIEDY NKGIMPFISY AHRHMSDSMV FLFPALLNIW 
LFRKNAIKLV FLVLSAIYLF FILGTLSRGA WLAVLIVGVL WAILNRQWKL IGVGAILLAI 
IGALVITQHN NKPDPEHLLY KLQQTDSSYR YTNGTQGTAW ILIQENPIKG YGYGNDVYDS 
VYNKRVVDYP TWTFKESIGP HNTILYIWFS AGILGLASLV YLYGAIIRET ASSTFRKVEI 
SPYNAHLLLF LSFVGFYIVR GNFEQVDIAQ IGIITGFLLA LRNR