Gene EcolC_3026 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3026
Symbol
ID	6066026
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	3305380
End bp	3306438
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	51%
IMG OID	641602442
Product	citrate lyase ligase
Protein accession	YP_001725977
Protein GI	170021023
COG category	[C] Energy production and conversion
COG ID	[COG3053] Citrate lyase synthetase
TIGRFAM ID	[TIGR00124] [citrate (pro-3S)-lyase] ligase [TIGR00125] cytidyltransferase-related domain

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCGGCA ATGATATTTT CACCCGCGTA AAACGTTCAG AAAATAAAAA AATGGCGGAA 
ATCGCCCAAT TCCTGCATGA AAATGATTTG AGCGTTGACA CCACAGTCGA AGTATTTATT 
ACCGTAACCC GCGATGAAAA GCTTATCGCG TGCGGTGGAA TTGCCGGAAA TATTATTAAA 
TGCGTTGCTA TCAGTGAATC CGTTCGCGGT GAAGGACTGG CGCTGACATT AGCCACTGAA 
CTGATAAACC TCGCCTATGA GCGGCACAGC ACGCATCTGT TTATTTATAC CAAAACCGAA 
TACGAGGCGC TGTTCCGCCA GTGCGGTTTT TCCACGCTGA CCAGCGTACC CGGCGTGATG 
GTGCTGATGG AAAACAGCGC CACGCGACTG AAACGCTATG CCGAATCGCT GAAAAAATTT 
CGTCATCCAG GGAACAAGAT TGGCTGCATT GTGATGAACG CCAATCCCTT TACGAATGGT 
CACCGTTATC TGATTCAACA AGCTGCGGCA CAGTGCGACT GGTTGCATCT GTTTTTAGTC 
AAAGAAGATT CTTCACGCTT CCCCTATGAA GACCGGCTGG ATCTGGTGTT AAAAGGCACC 
GCCGATATTC CACGCCTGAC TGTGCATCGC GGCTCCGAAT ACATCATCTC CCGCGCTACG 
TTCCCTTGCT ACTTCATTAA AGAACAGAGC GTCATTAACC ATTGTTACAC CGAAATTGAT 
CTGAAGATTT TCCGTCAGTA CCTCGCTCCC GCACTGGGTG TAACTCACCG CTTTGTCGGT 
ACTGAACCCT TTTGTCGCGT TACCGCCCAG TACAACCAGG ATATGCGCTA CTGGCTGGAA 
ACGCCGACTA TCTCCGCACC GCCCATCGAA CTGGTTGAAA TTGAGCGGCT GCGTTACCAG 
GAGATGCCGA TATCCGCTTC CCGGGTACGT CAACTGCTGG CGAAAAACGA TCTCACGGCT 
ATCGCGCCGC TGGTCCCTGC AGTCACGCTG CATTATTTGC AGAACCTGCT TGAGCACTCC 
CGCCAGGACG CGGCAGCTCG TCAAAAGACC CCCGCATGA

Protein sequence

MFGNDIFTRV KRSENKKMAE IAQFLHENDL SVDTTVEVFI TVTRDEKLIA CGGIAGNIIK 
CVAISESVRG EGLALTLATE LINLAYERHS THLFIYTKTE YEALFRQCGF STLTSVPGVM 
VLMENSATRL KRYAESLKKF RHPGNKIGCI VMNANPFTNG HRYLIQQAAA QCDWLHLFLV 
KEDSSRFPYE DRLDLVLKGT ADIPRLTVHR GSEYIISRAT FPCYFIKEQS VINHCYTEID 
LKIFRQYLAP ALGVTHRFVG TEPFCRVTAQ YNQDMRYWLE TPTISAPPIE LVEIERLRYQ 
EMPISASRVR QLLAKNDLTA IAPLVPAVTL HYLQNLLEHS RQDAAARQKT PA