Gene EcSMS35_4678 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4678
Symbol
ID	6145723
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	4776394
End bp	4777935
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	53%
IMG OID	641619494
Product	CoA-transferase
Protein accession	YP_001746602
Protein GI	170684002
COG category	[I] Lipid transport and metabolism
COG ID	[COG4670] Acyl CoA:acetate/3-ketoacid CoA transferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.696656
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTAAGA TAACAACCGC CGAGGCACTG GCGGCGCAAA TTCAGGACGG TGCGACTATT 
GCTATTAGCG GTAACGGCGG CGGTATGGTG GAAGCCGACC ATATTCTGGC TGCTATTGAA 
GCGCGTTTCC TGCAAACCGG ACACCCGCGC GATCTGACAT TAATCCACTC GCTGGGTATT 
GGCGATCGCG ACAGCAAAGG CACTAACCGT TTTGCTCACG CCGAAATGCT CAAACGCATT 
ATTGCCGGAC ATTTTACCTG GTCGCCCAAG ATGCAGGAAC TGGTGAAAAG CAATGCTATT 
GAAGCCTACT GTTTCCCTGG TGGCGTGATT CAGGCGTTGC TACGGGAGAT CGGTGCCGGA 
CGTCCGGGGC TTTTTACCCA CGTTGGGCTG GGATCGTTTG TTGATCCACG CAATGGCGGC 
GGTAAGTCGA ATGAATGCAC TACCACCGAC CTGGTAGAAC TGATTGAAAT CGATGGTGAA 
ACCAAACTTC GTTATCGCCC TTTCAAAGTG GATTACGCGA TTTTGCGTGG CACTTATGCC 
GATCCTCGAG GCAACGTCAG CCTTGAAGAA GAAGCGATTG ATATGGATAG CTATTCCATG 
GCGCTGGCAG CACACAACAG CGGCGGCAAA GTGTTCGTAC AGGTACGCGA TGTGCTGGAA 
GCTGGCGCGA TTGAACCACG TCGGGTCAAA TTACCGGGGA TTCTGGTTGA TGGCATCGTT 
GAGCACCGCG AACAACCGCA AACCTATCTT GGTGGTTACG ACCTGACCAT TAGCGGTCAA 
CATCGCCGTC TAAGTTCTAA CGACGCTATT GAACTGGTTA GTCATCCGGT GCGTCGCCTG 
ATTGCCCGTC GGGCAGCACG GGAACTGGTG GCAGGCGCTT CAACCAACTT TGGCTTTGGT 
ATTCCGGGCG GTATTCCAGG CGTAGCGCTG CGCGAAGGCG TGCCTTATCA AAGTTTGTGG 
CTGAGTGTAG AACAGGGTGT ACATAACGGC ATGATGCTGG ATGATGCTCT GTTCGGCTGC 
GCCCGTAACG CCGATGCCAT TATTCCATCA CTCGATCAAT TCGAATTCTA CAGTGGCGGA 
GGGATCGATA TCACCTTCCT CGGCATGGGA GAGATGGATC AGTACGGTAA CGTCAACGTC 
TCCCATCTCA ATGGCAATCT GATTGGCCCC GGCGGATTTC TCGAAATTGC GCAAAACGCC 
CGTAAAGTGG TGTTCTGCGG CACGTTCGAC GCCAAAGGTA GCAAGATTGA TGTAACGCCA 
GATGGCTTGC ATATCGCCCA GTCAGGTCAA ATCCCTAAAC TGGTTACCCA GGTGGAAAAA 
ATCACTTTTA GCGCCGCCTA CGCACAGCAA AGTGGTCAGG AAGTGTTGTA TATCACTGAA 
CGTGCAGTAT TCCAGTTAAC GGCAGAAGGC GTTGAATTAA TTGAAATCGC ACCAGGTGTG 
GAGATTGAGC GCGACATTCT GCCGTATATG GCCTTCCGTC CAATTATCAA TCAGCCACGC 
CTGATGGAAA GTAGCCTGTT TACGCCGATG GAGGATGCAT GA

Protein sequence

MRKITTAEAL AAQIQDGATI AISGNGGGMV EADHILAAIE ARFLQTGHPR DLTLIHSLGI 
GDRDSKGTNR FAHAEMLKRI IAGHFTWSPK MQELVKSNAI EAYCFPGGVI QALLREIGAG 
RPGLFTHVGL GSFVDPRNGG GKSNECTTTD LVELIEIDGE TKLRYRPFKV DYAILRGTYA 
DPRGNVSLEE EAIDMDSYSM ALAAHNSGGK VFVQVRDVLE AGAIEPRRVK LPGILVDGIV 
EHREQPQTYL GGYDLTISGQ HRRLSSNDAI ELVSHPVRRL IARRAARELV AGASTNFGFG 
IPGGIPGVAL REGVPYQSLW LSVEQGVHNG MMLDDALFGC ARNADAIIPS LDQFEFYSGG 
GIDITFLGMG EMDQYGNVNV SHLNGNLIGP GGFLEIAQNA RKVVFCGTFD AKGSKIDVTP 
DGLHIAQSGQ IPKLVTQVEK ITFSAAYAQQ SGQEVLYITE RAVFQLTAEG VELIEIAPGV 
EIERDILPYM AFRPIINQPR LMESSLFTPM EDA