Gene EcolC_3029 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3029
Symbol
ID	6065185
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	3307665
End bp	3309197
Gene Length	1533 bp
Protein Length	510 aa
Translation table	11
GC content	56%
IMG OID	641602445
Product	citrate lyase, alpha subunit
Protein accession	YP_001725980
Protein GI	170021026
COG category	[C] Energy production and conversion
COG ID	[COG3051] Citrate lyase, alpha subunit
TIGRFAM ID	[TIGR01584] citrate lyase, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCAGA AAATTGAACA ATCTCAACGA CAAGAACGGG TAGCGGCCTG GAATCGTCGC 
GCTGAATGCG ATCTTGCCGC TTTCCAGAAC TCACCAAAGC AAACCTACCA GGCTGAAAAA 
GCGCGCGATC GCAAACTGTG CGCCAACCTG GAAGAAGCGA TTCGTCGCTC TGGTTTACAG 
GACGGCATGA CGGTTTCCTT CCATCACGCT TTCCGTGGCG GTGACCTGAC CGTCAATATG 
GTGATGGACG TCATCGCGAA GATGGGCTTT AAAAACCTGA CCCTGGCGTC CAGCTCCCTG 
AGTGATTGCC ATGCGCCGCT GGTAGAACAC ATTCGCCAGG GCGTGGTTAC CCGCATTTAT 
ACCTCCGGCC TGCGTGGTCC ACTGGCGGAA GAGATCTCCC GTGGTCTGCT GGCGGAACCG 
GTGCAGATCC ACTCTCACGG CGGACGTGTG CATCTGGTAC AGAGCGGCGA ACTGAATATC 
GACGTGGCTT TCCTCGGCGT CCCGTCCTGT GATGAATTCG GTAATGCCAA CGGCTACACC 
GGTAAAGCCT GCTGCGGCTC CCTCGGCTAT GCAATGGTTG ATGCCGACAA CGCAAAACAG 
GTTGTGATGC TTACCGAAGA ACTGCTGCCT TATCCGCATA ATCCGGCAAG CATTGAGCAA 
GATCAGGTTG ATCTGATCGT CAAAGTTGAT CGCGTTGGCG ATGCTGCAAA AATCGGCGCT 
GGCGCTACCC GTATGACCAC TAACCCGCGC GAACTGCTTA TTGCCCGTAG CGCTGCGGAT 
GTGATTGTCA ACTCTGGCTA CTTCAAAGAA GGTTTCTCCA TGCAAACCGG CACCGGCGGC 
GCATCGCTGG CGGTAACCCG TTTCCTGGAA GACAAAATGC GTAGCCGCGA TATTCGCGCC 
GACTTCGCCC TTGGCGGTAT TACCGCGACG ATGGTTGACC TGCACGAAAA AGGTCTGATC 
CGCAAACTGC TGGATGTGCA GAGCTTTGAC AGCCATGCTG CGCAATCGCT GGCCCGTAAC 
CCCAATCACA TCGAAATCAG CGCCAACCAG TACGCTAACT GGGGTTCGAA AGGCGCATCG 
GTTGATCGTC TCGACGTGGT GGTACTGAGC GCGCTGGAAA TTGACACCCA GTTCAACGTT 
AACGTGCTGA CCGGCTCTGA CGGCGTACTG CGTGGTGCTT CCGGTGGTCA CTGCGATACC 
GCAATTGCCT CTGCGCTTTC CATCATCGTC GCGCCGCTGG TACGCGGTCG TATTCCGACT 
CTGGTGGATA ACGTGCTGAC CTGCATCACC CCGGGCTCCA GTGTCGATAT TCTGGTCACA 
GACCACGGTA TCGCAGTTAA CCCGGCACGT CCGGAACTGG CAGAACGTCT GCAGGAAGCG 
GGCATTAAAG TGGTTTCCAT TGAGTGGCTG CGCGAACGTG CGCGTCTGCT GACCGGTGAA 
CCACAGCCGA TTGAATTCAC CGACCGCGTC GTTGCCGTTG TGCGTTACCG CGATGGCTCG 
GTGATCGATG TTGTGCATCA GGTGAAGGAA TAA

Protein sequence

MTQKIEQSQR QERVAAWNRR AECDLAAFQN SPKQTYQAEK ARDRKLCANL EEAIRRSGLQ 
DGMTVSFHHA FRGGDLTVNM VMDVIAKMGF KNLTLASSSL SDCHAPLVEH IRQGVVTRIY 
TSGLRGPLAE EISRGLLAEP VQIHSHGGRV HLVQSGELNI DVAFLGVPSC DEFGNANGYT 
GKACCGSLGY AMVDADNAKQ VVMLTEELLP YPHNPASIEQ DQVDLIVKVD RVGDAAKIGA 
GATRMTTNPR ELLIARSAAD VIVNSGYFKE GFSMQTGTGG ASLAVTRFLE DKMRSRDIRA 
DFALGGITAT MVDLHEKGLI RKLLDVQSFD SHAAQSLARN PNHIEISANQ YANWGSKGAS 
VDRLDVVVLS ALEIDTQFNV NVLTGSDGVL RGASGGHCDT AIASALSIIV APLVRGRIPT 
LVDNVLTCIT PGSSVDILVT DHGIAVNPAR PELAERLQEA GIKVVSIEWL RERARLLTGE 
PQPIEFTDRV VAVVRYRDGS VIDVVHQVKE