Gene EcSMS35_0007 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0007
Symbol	tal2
ID	6144239
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	8061
End bp	9077
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	52%
IMG OID	641614908
Product	transaldolase B
Protein accession	YP_001742124
Protein GI	170681632
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0176] Transaldolase
TIGRFAM ID	[TIGR00874] transaldolase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATATCAT CAGGGCAGAC CGGTTACATC CCCCTAACAA GCTGTTTAAA GAGAAATACT 
ATCATGACGG ACAAATTGAC CTCCCTTCGT CAGTACACCA CCGTAGTGGC CGACACTGGG 
GACATCGCGG CAATGAAGCT GTATCAACCG CAGGATGCCA CAACCAACCC TTCTCTCATT 
CTTAACGCAG CGCAGATTCC GGAATACCGT AAGTTGATTG ATGATGCTGT CGCCTGGGCG 
AAACAGCAGA GCAACGATCG CGCGCAGCAG ATCGTGGACG CGACCGACAA ACTGGCAGTA 
AATATTGGTC TGGAAATCCT GAAACTGGTT CCGGGCCGTA TCTCAACTGA AGTTGATGCG 
CGTCTTTCCT ATGACACCGA AGCGTCAATT GCGAAAGCAA AACGCCTGAT CAAACTCTAC 
AACGATGCAG GGATTAGCAA CGATCGTATT CTGATCAAAC TGGCTTCTAC CTGGCAGGGT 
ATCCGTGCTG CGGAACAGCT GGAAAAAGAA GGCATCAACT GTAACCTGAC CCTGCTGTTC 
TCCTTTGCTC AGGCTCGTGC TTGTGCGGAA GCGGGCGTGT TCCTGATCTC GCCGTTTGTT 
GGCCGTATTC TTGACTGGTA CAAAGCGAAT ACCGATAAGA AAGAGTACGC TCCGGCAGAA 
GATCCGGGCG TGGTTTCTGT ATCTGAAATC TACCAGTACT ACAAAGAGCA CGGTTATGAA 
ACCGTGGTTA TGGGCGCAAG CTTCCGTAAC ATCGGCGAAA TTCTGGAACT GGCAGGCTGC 
GACCGTCTGA CCATCGCACC GGCACTGCTG AAAGAGCTGG CGGAGAGCGA AGGGGCTATC 
GAACGTAAAC TGTCTTACAC CGGCGAAGTG AAAGCGCGTC CGGCGCGTAT CACTGAGTCC 
GAGTTCCTGT GGCAGCACAA CCAGGATCCA ATGGCAGTAG ATAAACTGGC GGAAGGTATC 
CGTAAGTTTG CTGTTGACCA GGAAAAACTG GAAAAAATGA TCGGCGATCT GCTGTAA

Protein sequence

MISSGQTGYI PLTSCLKRNT IMTDKLTSLR QYTTVVADTG DIAAMKLYQP QDATTNPSLI 
LNAAQIPEYR KLIDDAVAWA KQQSNDRAQQ IVDATDKLAV NIGLEILKLV PGRISTEVDA 
RLSYDTEASI AKAKRLIKLY NDAGISNDRI LIKLASTWQG IRAAEQLEKE GINCNLTLLF 
SFAQARACAE AGVFLISPFV GRILDWYKAN TDKKEYAPAE DPGVVSVSEI YQYYKEHGYE 
TVVMGASFRN IGEILELAGC DRLTIAPALL KELAESEGAI ERKLSYTGEV KARPARITES 
EFLWQHNQDP MAVDKLAEGI RKFAVDQEKL EKMIGDLL