Gene EcSMS35_0364 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0364
Symbol	prpC
ID	6144059
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	374541
End bp	375710
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	56%
IMG OID	641615260
Product	methylcitrate synthase
Protein accession	YP_001742467
Protein GI	170680874
COG category	[C] Energy production and conversion
COG ID	[COG0372] Citrate synthase
TIGRFAM ID	[TIGR01800] 2-methylcitrate synthase/citrate synthase II

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACA CAACGATCCT GCAAAACAGT ACCCATGTCA TTAAACCGAA AAAATCGGTG 
GCGCTTTCTG GCGTTCCGGC GGGCAATACA GCGCTCTGCA CCGTGGGTAA AAGCGGCAAT 
GATTTGCATT ACCGCGGCTA CGACATTCTT GATCTGGCGG AACATTGCGA ATTTGAAGAA 
GTAGCGCATC TGCTGATCCA CGGCAAACTG CCGACCCGTG ACGAACTCGC CGCCTACAAA 
ACGAAACTGA AAGCCCTGCG CGGTTTACCG GCTAACGTGC GTACCGTGCT GGAAGCCTTA 
CCGGCGGCGT CACACCCGAT GGATGTTATG CGCACCGGCG TTTCCGCGCT CGGCTGCACG 
CTGCCAGAAA AAGAGGGGCA TACCGTCTCC GGCGCGCGTG ATATTGCCGA CAAACTGTTG 
GCGTCGCTGA GCTCGATTCT TCTCTACTGG TATCACTACA GCCACAACGG CGAACGCATC 
CAGCCGGAAA CCGATGACGA TTCTATAGGC GGTCATTTCC TGCATCTGCT GCATGGTGAA 
AAGCCGTCGC AAAGCTGGGA AAAGGCGATG CATATTTCGC TGGTGCTGTA CGCCGAACAC 
GAGTTTAACG CCTCCACCTT TACCAGCCGG GTGATTGCGG GCACCGGCTC TGACATGTAT 
TCAGCGATTA TCGGCGCGAT TGGCGCACTG CGCGGGCCGA AACACGGCGG GGCGAATGAA 
GTGTCGCTGG AGATCCAGCA ACGTTACGAA ACGCCGGACG AAGCCGAAGC CGATATCCGC 
AAGCGCGTGG AAAACAAAGA AGTGGTGATT GGTTTTGGAC ATCCGGTTTA TACCATCGCT 
GACCCGCGTC ATCAGGTGAT CAAACGCGTG GCGAAGCAGC TCTCGCAGGA AGGCGGCTCG 
CTGAAGATGT ACAACATCGC CGATCGCCTG GAAACGGTGA TGTGGGAGAG CAAAAAGATG 
TTCCCCAATC TCGACTGGTT CTCCGCTGTT TCCTACAAAA TGATGGGCGT TCCCACCGAG 
ATGTTCACAC CACTGTTTGT TATCGCCCGC GTCACCGGCT GGGCGGCGCA CATTATCGAA 
CAACGTCAGG ACAACAAAAT TATCCGTCCT TCCGCCAATT ATGTTGGACC GGAAGACCGC 
CAGTTTGTCG CGCTGGATAA GCGCCAGTAA

Protein sequence

MSDTTILQNS THVIKPKKSV ALSGVPAGNT ALCTVGKSGN DLHYRGYDIL DLAEHCEFEE 
VAHLLIHGKL PTRDELAAYK TKLKALRGLP ANVRTVLEAL PAASHPMDVM RTGVSALGCT 
LPEKEGHTVS GARDIADKLL ASLSSILLYW YHYSHNGERI QPETDDDSIG GHFLHLLHGE 
KPSQSWEKAM HISLVLYAEH EFNASTFTSR VIAGTGSDMY SAIIGAIGAL RGPKHGGANE 
VSLEIQQRYE TPDEAEADIR KRVENKEVVI GFGHPVYTIA DPRHQVIKRV AKQLSQEGGS 
LKMYNIADRL ETVMWESKKM FPNLDWFSAV SYKMMGVPTE MFTPLFVIAR VTGWAAHIIE 
QRQDNKIIRP SANYVGPEDR QFVALDKRQ