Gene EcHS_A1993 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1993
Symbol	otsA
ID	5592242
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	1999815
End bp	2001239
Gene Length	1425 bp
Protein Length	474 aa
Translation table	11
GC content	49%
IMG OID	640921139
Product	trehalose-6-phosphate synthase
Protein accession	YP_001458687
Protein GI	157161369
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0380] Trehalose-6-phosphate synthase
TIGRFAM ID	[TIGR02400] alpha,alpha-trehalose-phosphate synthase [UDP-forming]

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.000154738
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCGTT TAGTCGTAGT ATCTAACCGG ATTGCACCAC CAGACGAGCA CGCCGCCAGT 
GCCGGTGGCC TTGCCGTTGG CATACTGGGG GCACTGAAAG CCGCAGGCGG ACTGTGGTTT 
GGCTGGAGTG GTGAAACAGG GAATGAGGAT CAGCCGCTAA AAAAGGTGAA AAAAGGTAAC 
ATTACGTGGG CCTCTTTTAA CCTCAGCGAA CAGGACCTTG ACGAATACTA CAACCAATTC 
TCCAATGCCG TTCTCTGGCC CGCTTTTCAT TATCGGCTCG ATCTGGTGCA ATTTCAGCGT 
CCTGCCTGGG ACGGCTATCT ACGCGTAAAT GCGTTGCTGG CAGATAAATT ACTGCCGCTG 
TTGCAAGACG ATGACATTAT CTGGATCCAC GATTATCACC TGTTGCCATT TGCGCATGAA 
TTACGCAAAC GGGGAGTGAA TAATCGCATT GGTTTCTTTC TGCATATTCC TTTCCCGACA 
CCGGAAATCT TCAACGCGCT GCCGACATAT GACACCTTGC TTGAACAGCT TTGTGATTAT 
GATTTGCTGG GTTTCCAGAC AGAAAACGAT CGTCTGGCGT TCCTGGATTG TCTTTCTAAC 
CTGACCCGCG TCACGACACG TAGCGCAAAA AGCCATACAG CCTGGGGCAA AGCATTTCGA 
ACAGAAGTCT ACCCGATCGG CATTGAACCG AAAGAAATAG CCAAACAGGC TGCCGGGCCA 
CTGCCGCCAA AACTGGCGCA ACTTAAAGCG GAACTGAAAA ACGTACAAAA TATCTTTTCT 
GTCGAACGGC TGGATTATTC CAAAGGTTTG CCAGAGCGTT TTCTCGCCTA TGAAGTGTTG 
CTGGAAAAAT ATCCGCAGCA TCATGGTAAA ATTCGTTATA CCCAGATTGC ACCAACGTCG 
CGTGGTGATG TGCAAGCCTA TCAGGATATT CGTCATCAGC TCGAAAATGA AGCTGGACGA 
ATTAATGGTA AATACGGGCA ATTAGGCTGG ACGCCGCTTT ATTATTTGAA TCAGCATTTT 
GACCGTAAAT TACTGATGAA AATATTCCGC TACTCTGACG TGGGCTTAGT GACGCCACTG 
CGTGACGGGA TGAACCTGGT AGCAAAAGAG TATGTTGCTG CTCAGGACCC AGCCAATCCG 
GGCGTTCTTG TTCTTTCGCA ATTTGCGGGA GCGGCAAACG AGTTAACGTC GGCGTTAATT 
GTTAACCCCT ACGATCGTGA CGAAGTTGCA GCTGCGCTGG ATCGTGCATT GACTATGTCG 
CTGGCGGAAC GTATTTCCCG TCATGCAGAA ATGCTGGACG TTATCGTGAA AAACGATATT 
AACCACTGGC AGGAGTGCTT CATTAGCGAC CTAAAGCAGA TAGTTCCGCG AAGCGCGGAA 
AGCCAGCAGC GCGATAAAGT TGCTACCTTT CCAAAGCTTG CGTAG

Protein sequence

MSRLVVVSNR IAPPDEHAAS AGGLAVGILG ALKAAGGLWF GWSGETGNED QPLKKVKKGN 
ITWASFNLSE QDLDEYYNQF SNAVLWPAFH YRLDLVQFQR PAWDGYLRVN ALLADKLLPL 
LQDDDIIWIH DYHLLPFAHE LRKRGVNNRI GFFLHIPFPT PEIFNALPTY DTLLEQLCDY 
DLLGFQTEND RLAFLDCLSN LTRVTTRSAK SHTAWGKAFR TEVYPIGIEP KEIAKQAAGP 
LPPKLAQLKA ELKNVQNIFS VERLDYSKGL PERFLAYEVL LEKYPQHHGK IRYTQIAPTS 
RGDVQAYQDI RHQLENEAGR INGKYGQLGW TPLYYLNQHF DRKLLMKIFR YSDVGLVTPL 
RDGMNLVAKE YVAAQDPANP GVLVLSQFAG AANELTSALI VNPYDRDEVA AALDRALTMS 
LAERISRHAE MLDVIVKNDI NHWQECFISD LKQIVPRSAE SQQRDKVATF PKLA