Gene EcSMS35_1087 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1087
Symbol
ID	6145966
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	1103143
End bp	1104309
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	48%
IMG OID	641615973
Product	lyase
Protein accession	YP_001743165
Protein GI	170682542
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1027] Aspartate ammonia-lyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTCGTA TTGAAAGCGA TTTCCTTGGT GAGCGTGAAA TTCCGGATGA TTGCTATTAT 
GGTGTTCAGA CACTTCGTGG AAAAGATAAT TTCCATATCA CTGAAATGCC AATGAGTCAG 
GAGCCTTTCT TCATCATTGC CTTCGGTTAT GTGAAAAAAG CAGCTGCGAT GGCTAATAAG 
GAGTTAGGTA CAATTCCTGC TGATGTTGCG GATGCTTTAA TCTGGGCTTG CGACCAATTA 
ATTGATGGTA AGTACCGGGA ACAGTTTGTG ACCGACTGGC TTCAGGGGGG AGCCGGAACG 
TCAACCAATA TGAACTGCAA TGAAGTGATT TGTAATCTTG CTGCAGAAAA ACTTGGTAGC 
GTTAAAGGGG ATTACAAACG CGTTTCGCCA AACGACCATG CTAATTTTGG TCAGTCCACC 
AATGATACAT ATCCGACAGC ATTACATCTG GCATTGCTGC TGCGAAGCAA TGTATTGCTT 
GAAGCTGTTG AACACCTCGT AGGAGCATTC TACAAAAAGG CTGACGAGTT CAGCACAGTG 
CTCAAGATGG GACGTACTCA CCTGCAGGAT GCAGTGCCAA TGACTCTCGG CCAGGAGTTC 
CATGGCTGGG GTTTTACAAT TAATGATGAA ATTCGGGTCA TCCGTAATGC ACAGGAACAC 
CTGCGGGTTG TAAACCTTGG TGCTACTGCG ATTGGTACCT GTGTTACCGC TCACCCGGAT 
TATCCCGCTT TAGCCGTGAA ATATCTGGCC CAGATCACAG GCATTAATTT CAGGAACAGT 
GAAGATCTCA TCGCTGCCAC AAGCGACTGT GGTGCATATG TTGCACTCAG TTCGGCCATG 
AAGAGCCTCT CTGTGAAGCT TACCAAGGTT TGTAATGACA TTCGACTGCT TGCTTCAGGC 
CCCCGTTGCG GCCTGGCTGA AATTAACCTG CCTCAATTGC AACCGGGTTC TTCCATTATG 
CCTGGTAAGG TTAACCCCGT TATCCCGGAA GTAACAAACC AGTCTTGCTT CCTGGTTCAG 
GGGCTGGACA CCACAGTGAT GCTGGCGGCA TCTGCTGGTC AGCTTGAGCT TAACGTTATG 
TGGATTTGCC CCTATATTTC CAGACACCTG TTATCACTTA ACCCATTACT GGCCTGCTGC 
CGCAGATATT CCCGTGGCGA GCGATAA

Protein sequence

MSRIESDFLG EREIPDDCYY GVQTLRGKDN FHITEMPMSQ EPFFIIAFGY VKKAAAMANK 
ELGTIPADVA DALIWACDQL IDGKYREQFV TDWLQGGAGT STNMNCNEVI CNLAAEKLGS 
VKGDYKRVSP NDHANFGQST NDTYPTALHL ALLLRSNVLL EAVEHLVGAF YKKADEFSTV 
LKMGRTHLQD AVPMTLGQEF HGWGFTINDE IRVIRNAQEH LRVVNLGATA IGTCVTAHPD 
YPALAVKYLA QITGINFRNS EDLIAATSDC GAYVALSSAM KSLSVKLTKV CNDIRLLASG 
PRCGLAEINL PQLQPGSSIM PGKVNPVIPE VTNQSCFLVQ GLDTTVMLAA SAGQLELNVM 
WICPYISRHL LSLNPLLACC RRYSRGER