Gene EcHS_A3300 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3300
Symbol	sdaA1
ID	5592210
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3307123
End bp	3308487
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	53%
IMG OID	640922418
Product	L-serine ammonia-lyase
Protein accession	YP_001459912
Protein GI	157162594
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1760] L-serine deaminase
TIGRFAM ID	[TIGR00720] L-serine dehydratase, iron-sulfur-dependent, single chain form

Plasmid Coverage information

Num covering plasmid clones	57
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTAGTG CATTCGATAT TTTCAAAATT GGGATTGGTC CCTCCAGTTC GCATACCGTG 
GGGCCAATGA ATGCCGGAAA AAGTTTTATT GATCGGCTGG AAAGTAGCGG CTTATTAACC 
GCGACGAGCC ATATTGTGGT CGATCTGTAC GGGTCGTTGT CACTGACGGG CAAAGGCCAT 
GCCACGGATG TCGCCATCAT CATGGGACTG GCAGGAAACA GTCCGCAGGA TGTTGTCATT 
GATGAGATCC CTGCATTTAT AGAGTTAGTA ACGCGCAGCG GGCGGCTGCC AGTGGCATCT 
GGTGCGCATA TTGTTGATTT TCCTGTAGCA AAGAACATTA TCTTCCATCC CGAAATGTTG 
CCTCGCCATG AGAACGGAAT GCGGATCACT GCCTGGAAGG GACAGGAAGA GCTATTAAGT 
AAAACCTATT ACTCTGTCGG CGGCGGGTTT ATTGTCGAAG AAGAACACTT CGGCCTGTCG 
CACGATGTCG AAACGTCCGT ACCTTACGAT TTCCACTCAG CAGGTGAACT GCTGAAAATG 
TGTGATTACA ACGGCCTGTC TATATCTGGT CTGATGATGC ACAACGAGCT AGCGCTGCGC 
AGCAAAGCGG AAATTGACGC CGGTTTTGCC CGTATCTGGC AAGTGATGCA TGACGGTATT 
GAACGTGGGA TGAACACTGA AGGCGTGCTG CCTGGTCCGC TCAATGTGCC GCGCCGTGCC 
GTAGCGCTGC GTCGTCAGCT GGTTTCCAGC GATAACATCT CTAACGATCC GATGAATGTC 
ATCGACTGGA TCAACATGTA CGCGCTGGCG GTTAGTGAAG AAAACGCAGC TGGCGGGCGC 
GTGGTAACGG CACCGACTAA CGGTGCGTGC GGCATTATTC CGGCAGTACT GGCTTATTAC 
GATAAGTTCC GTCGTCCGGT AAACGAGCGG TCAATTGCCC GCTATTTTCT GGCCGCGGGG 
GCTATTGGCG CGCTGTATAA AATGAACGCC TCCATCTCTG GCGCGGAAGT CGGCTGTCAG 
GGGGAGATTG GCGTGGCCTG TTCAATGGCG GCGGCAGGGT TAACTGAACT ACTGGGCGGC 
AGTCCGGCGC AGGTATGCAA TGCGGCGGAA ATCGCGATGG AGCATAACCT TGGGCTGACC 
TGCGATCCGG TTGCCGGACA GGTACAAATC CCGTGCATTG AACGTAATGC CATTAATGCC 
GTGAAAGCAG TAAACGCCGC GCGGATGGCG ATGCGCCGCA CCTCGGCACC GCGTGTTTCA 
CTCGATAAAG TGATCGAGAC GATGTATGAA ACCGGCAAAG ATATGAACGA TAAATACCGC 
GAAACATCAC GCGGAGGACT GGCCATTAAA GTGGTCTGCG GCTGA

Protein sequence

MISAFDIFKI GIGPSSSHTV GPMNAGKSFI DRLESSGLLT ATSHIVVDLY GSLSLTGKGH 
ATDVAIIMGL AGNSPQDVVI DEIPAFIELV TRSGRLPVAS GAHIVDFPVA KNIIFHPEML 
PRHENGMRIT AWKGQEELLS KTYYSVGGGF IVEEEHFGLS HDVETSVPYD FHSAGELLKM 
CDYNGLSISG LMMHNELALR SKAEIDAGFA RIWQVMHDGI ERGMNTEGVL PGPLNVPRRA 
VALRRQLVSS DNISNDPMNV IDWINMYALA VSEENAAGGR VVTAPTNGAC GIIPAVLAYY 
DKFRRPVNER SIARYFLAAG AIGALYKMNA SISGAEVGCQ GEIGVACSMA AAGLTELLGG 
SPAQVCNAAE IAMEHNLGLT CDPVAGQVQI PCIERNAINA VKAVNAARMA MRRTSAPRVS 
LDKVIETMYE TGKDMNDKYR ETSRGGLAIK VVCG