Gene SNSL254_A3994 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A3994
Symbol
ID	6483603
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	3881999
End bp	3883144
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	41%
IMG OID	642739254
Product	lipopolysaccharide 1,2-N-acetylglucosaminetransferase
Protein accession	YP_002042964
Protein GI	194443168
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	69
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTAAAA AAATCATATT TACTGTTACT CCTATATTTT CAATTCCTCC TCGTGGTGCG 
GCTGCGGTAG AAACCTGGAT TTACCAGGTT GCAAAACGAC TATCAATACC GAGTGCTATT 
GCTTGTATAA AGAATGCTGG CTATCCTGAA TATAATAAAA TAAACGATAA TTGTGATATT 
CATTACATTG GGTTTAGTAA AGTTTATAAG CGTCTTTTTC AGAAATGGAC TCGTCTCGAC 
CCACTACCCT ATTCCCAGCG CGTCCTTAAT ATTAGAGATA AAGTGACTAC CCAGGAAGAT 
AGCGTCATTG TTATTCATAA TAGTATGAAA CTGTATCGGC AGATCAGAGA GCGCAATCCG 
AATGCAAAAC TGGTTATGCA CATGCATAAC GCATTTGAAC CAGAACTTCC TGATAACGAT 
GCAAAAATTA TCGTGCCCAG TCAGTTTCTT AAAGCGTTTT ATGAAGAAAG ATTGCCTGCC 
GCTGCTGTTA GTATTGTGCC TAATGGTTTT TGTGCTGAGA CTTATAAAAG AAACCCACAA 
GATAATCTTC GTCAGCAATT AAATATTGCG GAAGATGCCA CCGTTCTCTT ATATGCCGGG 
AGAATTTCGC CTGATAAAGG CATCCTGTTG CTTTTGCAGG CGTTCAAACA ATTACGTACC 
TTAAGAAGTA ATATTAAACT TGTCGTTGTT GGCGACCCTT ATGCAAGCCG CAAGGGTGAA 
AAAGCAGAGT ATCAAAAGAA AGTACTGGAC GCCGTAAAAG AGATTGGAAC GGATTGTATT 
ATGGCAGGGG GGCAATCTCC CGACCAGATG CATAACTTCT ATCATATAGC CGATCTGGTT 
ATTGTGCCAT CTCAGGTTGA AGAAGCATTT TGCATGGTAG CTGTAGAAGC GATGGCAGCA 
GGAAAAGCGG TTCTTGCCAG CAAAAAAGGG GGGATTAGCG AATTTGTGTT AGATGGCATA 
ACGGGCTATC ACCTCGCAGA GCCTATGTCG AGCGACAGTA TAATTAATGA TATTAAACGT 
GCGCTTGCTG ATAAGGAACG CCACCAGATT GCCGAAAAAG CAAAATCCCT GGTGTTTTCA 
AAATACAGTT GGGAAAATGT AGCGCAGCGT TTCGAGGAAC AAATGAAAAG CTGGTTTGAT 
AAGTGA

Protein sequence

MIKKIIFTVT PIFSIPPRGA AAVETWIYQV AKRLSIPSAI ACIKNAGYPE YNKINDNCDI 
HYIGFSKVYK RLFQKWTRLD PLPYSQRVLN IRDKVTTQED SVIVIHNSMK LYRQIRERNP 
NAKLVMHMHN AFEPELPDND AKIIVPSQFL KAFYEERLPA AAVSIVPNGF CAETYKRNPQ 
DNLRQQLNIA EDATVLLYAG RISPDKGILL LLQAFKQLRT LRSNIKLVVV GDPYASRKGE 
KAEYQKKVLD AVKEIGTDCI MAGGQSPDQM HNFYHIADLV IVPSQVEEAF CMVAVEAMAA 
GKAVLASKKG GISEFVLDGI TGYHLAEPMS SDSIINDIKR ALADKERHQI AEKAKSLVFS 
KYSWENVAQR FEEQMKSWFD K