Gene EcolC_1388 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1388
Symbol
ID	6067985
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	1521517
End bp	1522872
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	56%
IMG OID	641600808
Product	O-succinylbenzoic acid--CoA ligase
Protein accession	YP_001724379
Protein GI	170019425
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID	[TIGR01923] O-succinylbenzoate-CoA ligase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCTTCT CTGACTGGCC GTGGCGTCAC TGGCGGCAAG TGCGGGGAGA AACCATCGCC 
TTACGTCTTA ATGACGAGCA ACTCAACTGG CGCGAGCTTT GTGCTCGCGT CGATGAATTA 
GCCTCCGGAT TTGCGGTGCA GGGGGTGGTT GAGGGCAGCG GCGTGATGTT GCGGGCGTGG 
AATACGCCGC AAACGCTGCT CGCCTGGCTG GCGTTACTGC AATGCGGGGC GCGGGTGTTG 
CCCGTGAACC CTCAGCTGCC GCAACCGTTG CTTGAAGAAT TGCTGCCCAA TCTGACGCTG 
CAATTTGCGC TGGTGCCGGA TGGGGAAAAC ACGTTTCCGG CATTAACGTC GCTGCACATT 
CAGCGGGTTG AAGGCGCACA TGCCGCTACG TGGCAGCCGA CGCGTCTGTG CTCAATGACG 
TTGACCTCGG GTTCTACCGG GTTGCCGAAA GCCGCTGTCC ATACTTATCA GGCCCATCTT 
GCCAGTGCCG AAGGGGTGTT ATCGTTGATT CCGTTTGGCG ATCACGATGA CTGGTTGCTC 
TCTTTACCGC TGTTTCACGT CTCCGGTCAG GGAATTATGT GGCGCTGGTT ATACGCTGGT 
GCGCGGGTGA CGGTGCGTGA TAAACAGCCA TTGGAGCAAA TGCTGGCAGG CTGTACTCAC 
GCTTCACTGG TGCCAACACA ACTCTGGCGT TTGCTGGTTA ACCGCAGTTC CGTTTCCCTG 
AAAGCGGTGT TACTTGGCGG CGCGGCTATC CCGGTCGAGT TGACGGAACA GGCGCGCGAG 
CAGGGGATTC GTTGCTTTTG CGGCTATGGT CTGACCGAGT TTGCCTCCAC GGTGTGTGCG 
AAAGAAGCCG ACGGCCTGGC AGACGTTGGT TCGCCGCTGC CGGGTCGGGA AGTGAAAATC 
GTTAATAATG AAGTGTGGCT GCGGGCTGCC AGTATGGCAG AAGGTTACTG GCGTAACGGG 
CAACTGGTTT CACTGGTTAA TGACGAAGGC TGGTACGCTA CGCGCGATCG CGGTGAGATG 
CATAATGGCA AGCTGACCAT TGTCGGACGT TTAGACAATC TATTCTTCAG TGGCGGAGAG 
GGTATTCAGC CGGAAGAAGT CGAGCGCGTA ATTGCTGCAC ATCCTGCGGT TTTGCAGGTG 
TTTATCGTCC CCGTTGCCGA CAAGGAGTTT GGTCATCGAC CGGTGGCGGT GATGGAGTAT 
GACCACGAGA GCGTTGATCT TAGTGAATGG GTGAAAGATA AGCTGGCCCG TTTTCAGCAA 
CCGGTGCGTT GGTTAACGTT GCCGCCTGAA CTGAAAAACG GCGGTATTAA AATTTCACGT 
CAGGCGCTAA AAGAGTGGGT GCAACGTCAG CAATAA

Protein sequence

MIFSDWPWRH WRQVRGETIA LRLNDEQLNW RELCARVDEL ASGFAVQGVV EGSGVMLRAW 
NTPQTLLAWL ALLQCGARVL PVNPQLPQPL LEELLPNLTL QFALVPDGEN TFPALTSLHI 
QRVEGAHAAT WQPTRLCSMT LTSGSTGLPK AAVHTYQAHL ASAEGVLSLI PFGDHDDWLL 
SLPLFHVSGQ GIMWRWLYAG ARVTVRDKQP LEQMLAGCTH ASLVPTQLWR LLVNRSSVSL 
KAVLLGGAAI PVELTEQARE QGIRCFCGYG LTEFASTVCA KEADGLADVG SPLPGREVKI 
VNNEVWLRAA SMAEGYWRNG QLVSLVNDEG WYATRDRGEM HNGKLTIVGR LDNLFFSGGE 
GIQPEEVERV IAAHPAVLQV FIVPVADKEF GHRPVAVMEY DHESVDLSEW VKDKLARFQQ 
PVRWLTLPPE LKNGGIKISR QALKEWVQRQ Q