Gene EcSMS35_1116 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1116
Symbol
ID	6143285
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	1131997
End bp	1133397
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	48%
IMG OID	641615996
Product	putative aspartate ammonia-lyase
Protein accession	YP_001743188
Protein GI	170683617
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1027] Aspartate ammonia-lyase
TIGRFAM ID	[TIGR00839] aspartate ammonia-lyase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTCGTA TTGAAAGCGA TTTCCTTGGT GAGCGTGAAG TTCCGGATGA TTGCTATTAT 
GGTGTTCAGA CACTTCGTGG TGAGGATAAT TTCCATATTA CTGAAATGCC AATGAGTCAG 
GAGCCCTTCT TCATCATTGC CTTCGGTTAT GTGAAAAAAG CAGCTGCGAT GGCTAATAAG 
GAGTTAGGTA CAATTCCTGC TGATGTTGCG GATGCTTTAA TCTGGGCTTG CGACCAATTA 
ATTGATGGTA AGTACCGGGA ACAGTTTGTG ACCGACTGGC TTCAGGGGGG AGCCGGAACG 
TCAACCAATA TGAACTGCAA TGAAGTGATT TGTAATCTTG CTGCAGAAAA ACTTGGTAGC 
GTTAAAGGGG ATTACAAACG CGTTTCGCCA AACGACCATG CTAATTTTGG TCAGTCCACC 
AATGATACAT ATCCGACAGC ATTACATCTG GCATTGCTGC TGCGAAGCAA TGTATTGCTT 
GAAGCTGTTG AACACCTCGT AGGAGCATTC TACAAAAAGG CTGACGAGTT CAGCACAGTG 
CTCAAGATGG GACGTACTCA CCTGCAGGAT GCAGTGCCAA TGACTCTCGG CCAGGAGTTC 
CATGGCTGGG GTTTTACAAT TAATGATGAA ATTCGGGTCA TCCGTAATGC ACAGGAACAC 
CTGCGGGTTG TAAACCTTGG TGCTACTGCG ATTGGTACCT GTGTTACCGC TCACCCGGAT 
TATCCCGCTT TAGCCGTGAA ATATCTGGCC CAGATCACAG GCATTAATTT CAGGAACAGT 
GAAGATCTCA TCGCTGCCAC AAGCGACTGT GGTGCATATG TTGCACTCAG TTCGGCCATG 
AAGAGCCTCT CTGTGAAGCT TACCAAGGTT TGTAATGACA TTCGACTGCT TGCTTCAGGC 
CCCCGTTGCG GCCTGGCTGA AATTAACCTG CCTCAATTGC AACCGGGTTC TTCCATTATG 
CCTGGTAAGG TTAACCCCGT TATCCCGGAA GTAACAAACC AGTCTTGCTT CCTGGTTCAG 
GGGCTGGACA CCACAGTGAT GCTGGCGGCA TCTGCTGGTC AGCTTGAGCT TAACGTTATG 
GAGCCGGTCA TCACCTTTGC GCTGTTCACC TCACTCAAGG TGATGACGAA TGCCTGTAAC 
ACACTCCGAA CTAAATGCAT TGATGGCATT ACAGCTAATT CCGATCGAAC TGCAGAGATG 
GTAATGCATT CCTGCGGTAT TGTGACTCTC CTGAAGCCAC ATCTGGGATA TAAGGTGTGT 
TCTGAAATGG CGCACGAAGC ATACCATACA GGCAAATCCC TCCATCAGAT AGTGGTTGTC 
GAACGTAAGC TACTCACACA GGAAGAATGG GAGAAGACAT TCAATCTGGA TAATCTGATT 
GCTCCGAAGT TCGAACAATA A

Protein sequence

MSRIESDFLG EREVPDDCYY GVQTLRGEDN FHITEMPMSQ EPFFIIAFGY VKKAAAMANK 
ELGTIPADVA DALIWACDQL IDGKYREQFV TDWLQGGAGT STNMNCNEVI CNLAAEKLGS 
VKGDYKRVSP NDHANFGQST NDTYPTALHL ALLLRSNVLL EAVEHLVGAF YKKADEFSTV 
LKMGRTHLQD AVPMTLGQEF HGWGFTINDE IRVIRNAQEH LRVVNLGATA IGTCVTAHPD 
YPALAVKYLA QITGINFRNS EDLIAATSDC GAYVALSSAM KSLSVKLTKV CNDIRLLASG 
PRCGLAEINL PQLQPGSSIM PGKVNPVIPE VTNQSCFLVQ GLDTTVMLAA SAGQLELNVM 
EPVITFALFT SLKVMTNACN TLRTKCIDGI TANSDRTAEM VMHSCGIVTL LKPHLGYKVC 
SEMAHEAYHT GKSLHQIVVV ERKLLTQEEW EKTFNLDNLI APKFEQ