Gene EcSMS35_3408 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3408
Symbol	tdcG
ID	6144161
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3488513
End bp	3489883
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	53%
IMG OID	641618237
Product	L-serine ammonia-lyase TdcG
Protein accession	YP_001745386
Protein GI	170680456
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1760] L-serine deaminase
TIGRFAM ID	[TIGR00720] L-serine dehydratase, iron-sulfur-dependent, single chain form

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGATATGA TTAGTGCATT CGATATTTTC AAAATTGGGA TTGGTCCCTC CAGTTCGCAT 
ACCGTGGGGC CAATGAATGC CGGAAAAAGT TTTATTGATC GGCTGGAAAG TAGCGGCTTA 
TTAACCGCGA CGAGCCATAT TGTGGTCGAT CTGTACGGGT CGTTGTCACT GACGGGCAAA 
GGCCATGCCA CGGATGTCGC CATCATCATG GGACTGGCAG GAAACAGTCC GCAGGATGTT 
GTCATTGATG AGATCCCTGC ATTTATAGAG TTAGTGACGC GCAGCGGGCG GCTGCCAGTG 
GCATCTGGTG CGCATATTGT TGATTTTCCT GTAGCAAAGA ACATTATCTT CCATCCCGAA 
ATGTTGCCTC GCCATGAGAA CGGAATGCGG ATCACTGCCT GGAAGGGACA GGAAGCGCTA 
TTAAGCAAAA CCTATTACTC TGTCGGCGGC GGGTTTATTG TCGAAGAAGA ACACTTCGGC 
CTGTCGCACG ATGTCGAAAC GTCCGTACCT TACGATTTCC ACTCAGCAGG AGAACTGCTG 
AAAATGTGTG ATTACAACGG CCTGTCTATT TCTGGCCTGA TGATGCACAA CGAGCTGGCG 
CTGCGCAGTA AAGCGGAAAT TGATGCCGGT TTTGCCCGTA TCTGGCAAGT GATGCATGAC 
GGTATTGAAC GCGGGATGAA CACTGAAGGC GTGCTGCCTG GTCCGCTCAA TGTGCCGCGC 
CGTGCCGTAG CGCTGCGTCG TCAGTTGGTT TCCAGCGATA ACATCTCTAA CGATCCGATG 
AATGTCATCG ACTGGATCAA CATGTACGCG CTGGCGGTTA GTGAAGAAAA CGCAGCTGGC 
GGGCGCGTGG TAACGGCACC GACTAACGGT GCGTGCGGCA TTATTCCGGC AGTGCTGGCT 
TATTACGATA AGTTCCGTCG TCCGGTAAAT GAGCGGTCAA TTGCCCGCTA TTTTCTTGCA 
GCCGGGGCTA TTGGCGCGCT GTATAAAATG AACGCCTCCA TCTCTGGCGC GGAAGTCGGC 
TGTCAGGGGG AGATTGGCGT GGCCTGTTCA ATGGCGGCGG CAGGGTTAAC TGAACTACTG 
GGCGGCAGTC CGGCGCAGGT ATGCAATGCG GCGGAAATCG CGATGGAGCA TAACCTTGGG 
CTGACCTGCG ATCCGGTTGC CGGACAGGTA CAAATCCCGT GCATTGAACG TAATGCCATT 
AATGCCGTGA AAGCAGTAAA CGCCGCGCGG ATGGCGATGC GCCGCACCTC GGCACCGCGT 
GTTTCACTCG ATAAAGTGAT CGAGACGATG TATGAAACCG GCAAAGATAT GAACGATAAA 
TACCGCGAAA CATCACGCGG AGGACTGGCT ATTAAAGTGG TCTGCGGCTG A

Protein sequence

MDMISAFDIF KIGIGPSSSH TVGPMNAGKS FIDRLESSGL LTATSHIVVD LYGSLSLTGK 
GHATDVAIIM GLAGNSPQDV VIDEIPAFIE LVTRSGRLPV ASGAHIVDFP VAKNIIFHPE 
MLPRHENGMR ITAWKGQEAL LSKTYYSVGG GFIVEEEHFG LSHDVETSVP YDFHSAGELL 
KMCDYNGLSI SGLMMHNELA LRSKAEIDAG FARIWQVMHD GIERGMNTEG VLPGPLNVPR 
RAVALRRQLV SSDNISNDPM NVIDWINMYA LAVSEENAAG GRVVTAPTNG ACGIIPAVLA 
YYDKFRRPVN ERSIARYFLA AGAIGALYKM NASISGAEVG CQGEIGVACS MAAAGLTELL 
GGSPAQVCNA AEIAMEHNLG LTCDPVAGQV QIPCIERNAI NAVKAVNAAR MAMRRTSAPR 
VSLDKVIETM YETGKDMNDK YRETSRGGLA IKVVCG