Gene EcHS_A2941 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2941
Symbol	sdaB
ID	5594010
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	2947785
End bp	2949152
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	54%
IMG OID	640922059
Product	L-serine ammonia-lyase
Protein accession	YP_001459569
Protein GI	157162251
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1760] L-serine deaminase
TIGRFAM ID	[TIGR00720] L-serine dehydratase, iron-sulfur-dependent, single chain form

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	0.73805
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTAGCG TATTCGATAT TTTCAAAATC GGCATTGGCC CTTCCAGTTC TCATACCGTT 
GGACCAATGA AAGCGGGTAA ACAATTTACC GACGATCTGA TTGCCCATAA TCTGCTTAAA 
GACGTGACCC GCGTGGTGGT TGACGTGTAC GGCTCGCTCT CTCTGACCGG TAAAGGCCAC 
CACACTGATA TCGCCATTAT TATGGGCCTG GCGGGTAACC TGCCGGATAC CGTGGATATC 
GATTCCATCC CTGGTTTTAT TCAGGATGTG AATACTCATG GTCGCCTGAT GCTGGCAAAC 
GGTCAGCATG AAGTGGAGTT CCCGGTTGAT CAGTGCATGA ACTTCCATGC AGACAACCTT 
TCTCTGCATG AAAACGGTAT GCGCATTACC GCGCTGGCGG GCGATAAAGT CGTTTACAGC 
CAGACTTACT ACTCTATTGG CGGTGGCTTT ATCGTTGATG AAGAGCATTT TGGCCAGCAG 
AATAGCGCAC CGGTTGAAGT TCCTTATCCG TACAGTTCAG CAGCCGATCT GCAAAAACAT 
TGTCAGGAAA CCGGGCTGTC ACTCTCTGGC CTGATGATGA AAAATGAGCT GGCGCTGCAC 
AGCAAAGAAG AGCTGGAACA GCACCTGGCG AACGTATGGG AAGTCATGCG TGGCGGTATT 
GAGCGCGGTA TTTCCACCGA AGGCGTGTTG CCTGGCAAAC TGCGCGTTCC ACGCCGTGCT 
GCGGCACTAC GCCGGATGCT GGTCAGCCAG GATAAAACCA CCACTGACCC GATGGCGGTT 
GTTGACTGGA TCAACATGTT TGCACTGGCA GTGAACGAAG AGAACGCTGC TGGCGGACGC 
GTGGTGACTG CGCCGACTAA CGGTGCGTGC GGGATTATCC CGGCAGTGCT GGCGTACTAC 
GACAAGTTTA TCCGCGAAGT GAACGCTAAC TCACTGGCTC GTTACCTGCT GGTAGCCAGT 
GCCATTGGTT CTCTTTATAA GATGAACGCG TCAATTTCTG GTGCTGAAGT CGGCTGCCAG 
GGTGAAGTTG GTGTGGCGTG CTCAATGGCG GCGGCTGGTC TGGCAGAGCT GTTAGGTGCA 
AGCCCGGCGC AGGTGTGCAT CGCGGCGGAA ATCGCCATGG AGCACAACCT CGGTCTGACG 
TGTGACCCGG TCGCCGGACA GGTCCAGGTG CCATGCATCG AGCGTAACGC CATTGCGGCA 
GTAAAAGCGG TGAACGCCGC ACGTATGGCG CTACGCCGTA CCAGCGAGCC GCGCGTCTGC 
CTCGATAAAG TTATCGAAAC CATGTACGAA ACAGGTAAAG ATATGAACGC CAAGTACCGC 
GAAACCTCTC GCGGCGGCCT GGCAATGAAG ATCGTTGCCT GCGATTAA

Protein sequence

MISVFDIFKI GIGPSSSHTV GPMKAGKQFT DDLIAHNLLK DVTRVVVDVY GSLSLTGKGH 
HTDIAIIMGL AGNLPDTVDI DSIPGFIQDV NTHGRLMLAN GQHEVEFPVD QCMNFHADNL 
SLHENGMRIT ALAGDKVVYS QTYYSIGGGF IVDEEHFGQQ NSAPVEVPYP YSSAADLQKH 
CQETGLSLSG LMMKNELALH SKEELEQHLA NVWEVMRGGI ERGISTEGVL PGKLRVPRRA 
AALRRMLVSQ DKTTTDPMAV VDWINMFALA VNEENAAGGR VVTAPTNGAC GIIPAVLAYY 
DKFIREVNAN SLARYLLVAS AIGSLYKMNA SISGAEVGCQ GEVGVACSMA AAGLAELLGA 
SPAQVCIAAE IAMEHNLGLT CDPVAGQVQV PCIERNAIAA VKAVNAARMA LRRTSEPRVC 
LDKVIETMYE TGKDMNAKYR ETSRGGLAMK IVACD