Gene SNSL254_A2089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A2089
Symbol	otsA
ID	6482798
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	2028249
End bp	2029670
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	53%
IMG OID	642737445
Product	trehalose-6-phosphate synthase
Protein accession	YP_002041195
Protein GI	194446277
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0380] Trehalose-6-phosphate synthase
TIGRFAM ID	[TIGR02400] alpha,alpha-trehalose-phosphate synthase [UDP-forming]

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.148883
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	5.88528e-25
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGTCGTT TAGTCGTAGT ATCTAATCGA ATTGCCCCCC CGGATAATAA AGGCGGCGCC 
GGCGGCCTCG CCGTTGGCGT GCTTGGCGCG CTAAAAGCGG CTGGCGGGTT GTGGTTCGGC 
TGGAGTGGCG AGACAGGTAA CGAGGATGAG CCATTAAAAA AGGTGACAAA AGGTAATATT 
ACCTGGGCAT CGTTTAACCT GAGTGAACAA GATTACGAAG ATTATTACTG TCAATTTTCC 
AATGCGGTTC TCTGGCCAGC GTTCCACTAT CGTCTGGACC TGGTACAGTT TCAGCGCCCT 
GCATGGGAAG GCTATATGCG GGTGAATGCG CTATTAGCGG ATAAGTTATT GCCCCTCATT 
AAAGAGAACG ACATCATTTG GGTGCATGAC TACCACCTGT TACCGTTCGC CAGCGAGCTG 
CGTAAACGCG GCGTGAACAA CCGAATTGGT TTTTTCCTGC ATATTCCATT CCCGACCCCG 
GAGATTTTTA ACGCTTTACC GCCGCATGAT GAACTGCTGG AGCAGTTGTG TGACTTTGAT 
CTGCTCGGGT TCCAGACCGA AAATGATCGC CTGGCTTTTC TGGATAGCCT TTCGAGTCAA 
ACGCGAGTCA CGACTCGCAG CGGCAAGCAG CATATCGCGT GGGGTAAAGA CTTCCAGACA 
GAAGTGTATC CTATCGGTAT TGAGCCCGAT GAGATTGCTC TGCAGGCTGC CGGGCCGTTG 
CCGCCTAAAC TGGCGCAGCT CAAGGCGGAA CTGAAAAATG TGAAGAATAT TTTTTCCGTT 
GAGCGGCTGG ATTATTCGAA AGGGCTGCCG GAACGTTTTC TGGCGTATGA AGCGCTACTG 
GAAAACTATC CGCAGCATCG GGGAAAAATT CGTTATACCC AAATTGCGCC TACGTCACGC 
GGCGAAGTAC AGGCATATCA GGATATTCGC CACCAGCTTG AGACGGAAGC AGGCCGGATT 
AATGGGAAAT ATGGACAATT GGGCTGGACG CCGCTCTATT ATCTGAATCA GCATTTCGAC 
CGTAAACTGT TAATGAAGAT ATTCCGTTAT TCAGACGTCG GGCTCGTCAC CCCGTTGCGT 
GACGGGATGA ACCTGGTGGC GAAAGAGTTT GTCGCCGCGC AGGACCCCGC TAATCCTGGC 
GTACTGGTAC TGTCACAGTT TGCCGGCGCG GCGAATGAAC TGACGTCGGC GTTAATCGTC 
AATCCTTACG ATCGGGATGA CGTGGCGGCG GCGCTCAATC GTGCGTTAAC GATGCCCCTT 
GCCGAGCGTA TTTCGCGCCA TGCGGAAATG CTGGACGCGA TCGTTAAAAA TGACATTAAC 
CGCTGGCAGG AACGTTTTAT TCATGACCTA AAGGAGGTCA CGCCGCGTAG CCCTGAGCGT 
CAGCAGCAGA ACAACGTGGC GACGTTCCCT AAGCTGGCCT GA

Protein sequence

MSRLVVVSNR IAPPDNKGGA GGLAVGVLGA LKAAGGLWFG WSGETGNEDE PLKKVTKGNI 
TWASFNLSEQ DYEDYYCQFS NAVLWPAFHY RLDLVQFQRP AWEGYMRVNA LLADKLLPLI 
KENDIIWVHD YHLLPFASEL RKRGVNNRIG FFLHIPFPTP EIFNALPPHD ELLEQLCDFD 
LLGFQTENDR LAFLDSLSSQ TRVTTRSGKQ HIAWGKDFQT EVYPIGIEPD EIALQAAGPL 
PPKLAQLKAE LKNVKNIFSV ERLDYSKGLP ERFLAYEALL ENYPQHRGKI RYTQIAPTSR 
GEVQAYQDIR HQLETEAGRI NGKYGQLGWT PLYYLNQHFD RKLLMKIFRY SDVGLVTPLR 
DGMNLVAKEF VAAQDPANPG VLVLSQFAGA ANELTSALIV NPYDRDDVAA ALNRALTMPL 
AERISRHAEM LDAIVKNDIN RWQERFIHDL KEVTPRSPER QQQNNVATFP KLA