Gene SNSL254_A0786 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A0786
Symbol
ID	6483596
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	796333
End bp	798282
Gene Length	1950 bp
Protein Length	649 aa
Translation table	11
GC content	36%
IMG OID	642736198
Product	putative glycosyl transferase
Protein accession	YP_002039964
Protein GI	194443619
COG category	[R] General function prediction only
COG ID	[COG5610] Predicted hydrolase (HAD superfamily)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	0.0373928
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATATGA ACTTTAAAAA ATACAAGACC GTAAGCTTTG ATATCTTTGA TACATTGGTT 
AGCCGGAGGG TTTACCGTCC CAGAGATTTG TTTTCATTGA TGCAATCAAC TTTAGCAACT 
GAGAACTTTT TTATATCAGC GTGCGAGATT GATATTATTG ATAATTTTCC AGAGATAAGA 
GTTCAGGCGG AAGTAAGTGC CAGAGAGAAT AGGGTCAGGC GTTTTGGCGG CGAGCCGGAA 
GTACTCATAT CTGAAATATA CGATGAAATT TTAAAAAAGC ATCCGCAGCT TTCACCAGCG 
ACAGTAGAAA AGATAATCGA TCTGGAAATA CAAATGGAGA AGATTGTTTT ATATAAAAAT 
TCGCGTGGAA GCTGTTTGTT TGAAAAGGCT ATTAGTGATG GTTGCAAAGT TATTTTAATT 
AGTGATATGT ACCTTCCATC AGCAATATTA AAGGAGTTGT TAACATCATG TGGCTATGAT 
ATCAGTAACA TTCCAGTTTA TTCATCTGGT GAAGAGCGGC ACTCTAAAAA TAGTGGCAAG 
TTGTTTTCAA TAGTCAAGAA AAATGAAAAT GTAGATATTG CATCGTGGAT GCATGTTGGC 
GACAATGTTC ATGCAGATAT TCTGAACGCT AAAAAACTCG GTATAAATAC TCTCCATGCT 
GATTGGTCAG AGTATAATCA TGGGGTATCT AATCATTGGA AAGCTAAAGA TATTATTGGT 
GAATCTATTT GTAAGGCTTT ATTACTTAAA CAAGTTTCTG CTTTCCATCA AAATGATCCT 
TTAAACGAGA TAGGATTTAA AGTATTTGGT CCGTTATTAT TAGGTTATGT ATCCTGGTTA 
GCGAATCAGT TAAAGATTCA TAAAATTGAT AAAGCGCTTT TTTTAGCACG CGATGCTCAC 
TTAATCTATA AAATTTATAA TGAATACTTT TCAGAAGAAC ATGTAAAATG TGAATATTTA 
TATATATCCC GCGCATCAGC TTATATGGTG GGGATGACTG ATTGGCCGAT GCACAGGATT 
TGGCATCTTT TTGGTGGTAA GAATAAGAAA AGTATTAAAA AGATACTTGC TATCGCGGGG 
TTAGATGCGA GTGAGCATAT TTCAGATATA CATCATGTTG GTTTTCCTGA CGAGGAGTAT 
ATTCCTGTTT CAGGAGAGGA ACATAAGGTT CACTGGCTTA TAAATAAATT ATTTCCATAT 
ATTTTATTAA AAAATACTCA GCACAGGGAA GTTTACGCTG ATTACTTTAA AACGGCCTGT 
GAAGGTTATA AAAATATAGC ACTTATCGAT GTAGGATGGA TGGGTAATAT TCAATCAGTA 
TTTGCTCGTT CTTTAGGTGC GCAATGGGCA GAAAAACAAA TACATGGGTT TTATTTGGCA 
ACTTTTGCTG GCGCCAATGA TAACCGATCT ATTTATAATA AGATGTTTGG TTGGCTAACC 
AACTATGGCC ATCCCAACGA TAAGTGTGAT CTTTTCTTAT CAGGAGGGGT GGAAATAATG 
GAGTTCGCTA TGGCTGACAA TACTGGGTCA ACAATTGGCT ATAAAAAAAC GGATAATGGA 
ATAATTCCTG TACGTGAAGA TAGCAGTGGT TCTGAAATTG AGTATTTAAA AAAAGCAGCA 
AGATTGCAAT CAGGGATTAT TTCTTTTTTT GAGTACGTCA AACCGCTCAT ACAAAAAGGA 
AATTATGCAG CACTTAGTAG TGTTGTATTG TCAGAACCTT TTTTTGAATT GATAGCCAGA 
CCCTCAAGCG TTCAACTGGA CGCCTTATCT TCCCTCACAC ATTCAGAGTC CGCGGGATCT 
AACGCAGAAA GAATCGTGCT AGCCAAGAAA CTGCCTTTAA AGGATAAACT TTTTCCCGGA 
GAAAATTATA TCAAAGAGTT GAATGCCAGT TATTGGAAAG AAGGCTTTAA AAGGATCAAC 
AGAAAAAAAT TTTGGGCAAA ATATAACTAA

Protein sequence

MDMNFKKYKT VSFDIFDTLV SRRVYRPRDL FSLMQSTLAT ENFFISACEI DIIDNFPEIR 
VQAEVSAREN RVRRFGGEPE VLISEIYDEI LKKHPQLSPA TVEKIIDLEI QMEKIVLYKN 
SRGSCLFEKA ISDGCKVILI SDMYLPSAIL KELLTSCGYD ISNIPVYSSG EERHSKNSGK 
LFSIVKKNEN VDIASWMHVG DNVHADILNA KKLGINTLHA DWSEYNHGVS NHWKAKDIIG 
ESICKALLLK QVSAFHQNDP LNEIGFKVFG PLLLGYVSWL ANQLKIHKID KALFLARDAH 
LIYKIYNEYF SEEHVKCEYL YISRASAYMV GMTDWPMHRI WHLFGGKNKK SIKKILAIAG 
LDASEHISDI HHVGFPDEEY IPVSGEEHKV HWLINKLFPY ILLKNTQHRE VYADYFKTAC 
EGYKNIALID VGWMGNIQSV FARSLGAQWA EKQIHGFYLA TFAGANDNRS IYNKMFGWLT 
NYGHPNDKCD LFLSGGVEIM EFAMADNTGS TIGYKKTDNG IIPVREDSSG SEIEYLKKAA 
RLQSGIISFF EYVKPLIQKG NYAALSSVVL SEPFFELIAR PSSVQLDALS SLTHSESAGS 
NAERIVLAKK LPLKDKLFPG ENYIKELNAS YWKEGFKRIN RKKFWAKYN