Gene EcSMS35_1548 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1548
Symbol	nemA
ID	6144423
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	1535100
End bp	1536197
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	54%
IMG OID	641616425
Product	N-ethylmaleimide reductase
Protein accession	YP_001743603
Protein GI	170683580
COG category	[C] Energy production and conversion
COG ID	[COG1902] NADH:flavin oxidoreductases, Old Yellow Enzyme family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.284503
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	0.889457
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCATCTG AAAAACTGTA TTCCCCACTG AAAGTGGGCG CGATCACGGC GGCAAACCGT 
ATTTTTATGG CACCGCTGAC GCGTCTTCGC AGTATTGAAC CGGGTGACAT CCCTACCCCG 
TTGATGGCGG AATACTATCG CCAACGTGCC AGTGCCGGTT TGATTATTAG CGAAGCCACG 
CAAATTTCTG CCCAGGCAAA AGGGTATGCT GGTGCACCTG GCATCCATAG TCCGGAACAA 
ATTGCCGCAT GGAAAAAAAT TACCGCTGGC GTTCATGCTG AAAATGGTCA TATGGCCGTA 
CAGCTGTGGC ACACCGGACG CATTTCTCAC GCCAGCCTGC AACCTGGCGG TCAGGCACCG 
GTAGCGCCTT CCGCACTTAG CGCGGGAACA CGTACTTCTC TGCGCGATGA AAATGGTCAG 
GCGATCCGTG TTGAAACATC CATGCCGCGT GCGCTTGAAC TGGAAGAGAT TCCGGGTATC 
GTCAATGATT TCCGTCAGGC CATTTCTAAC GCGCGTGAAG CCGGTTTTGA TCTGGTAGAG 
CTCCACTCTG CTCATGGTTA TTTGCTGCAT CAGTTCCTTT CTCCTTCTTC AAACCATCGT 
ACCGATCAGT ACGGCGGCAG CGTGGAAAAT CGCGCACGTC TGGTGCTGGA AGTGGTCGAT 
GCAGGGATTG AAGAATGGGG TGCCGATCGC ATTGGCATTC GCGTTTCGCC AATCGGTACT 
TTCCAGAACA CAGATAACGG CCCGAATGAA GAAGCCGATG CACTGTATCT GATTGAACAA 
CTGGGTAAAC GCGGCATTGC TTATCTGCAT ATGTCAGAAC CAGATTGGGC GGGGGGTGAG 
CCGTATACTG ATGCGTTCCG CGAAAAAGTA CGCGCCCGTT TCCACGGTCC GATTATCGGC 
GCAGGTGCAT ACACGGTAGA AAAAGCCGAA ACGCTGATCG GCAAAGGGTT AATTGATGCG 
GTGGCATTTG GTCGTGACTG GATTGCGAAC CCGGATCTGG TCGCCCGCTT GCAACGCAAA 
GCTGAGCTTA ACCCACAGCG TGCCGAAAGT TTTTACGGTG GCGGCGCGGA AGGCTACACG 
GATTACCCGA CGCTGTAA

Protein sequence

MSSEKLYSPL KVGAITAANR IFMAPLTRLR SIEPGDIPTP LMAEYYRQRA SAGLIISEAT 
QISAQAKGYA GAPGIHSPEQ IAAWKKITAG VHAENGHMAV QLWHTGRISH ASLQPGGQAP 
VAPSALSAGT RTSLRDENGQ AIRVETSMPR ALELEEIPGI VNDFRQAISN AREAGFDLVE 
LHSAHGYLLH QFLSPSSNHR TDQYGGSVEN RARLVLEVVD AGIEEWGADR IGIRVSPIGT 
FQNTDNGPNE EADALYLIEQ LGKRGIAYLH MSEPDWAGGE PYTDAFREKV RARFHGPIIG 
AGAYTVEKAE TLIGKGLIDA VAFGRDWIAN PDLVARLQRK AELNPQRAES FYGGGAEGYT 
DYPTL