Gene EcolC_4015 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_4015
Symbol
ID	6064570
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	4414996
End bp	4416300
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	55%
IMG OID	641603426
Product	isocitrate lyase
Protein accession	YP_001726941
Protein GI	170021987
COG category	[C] Energy production and conversion
COG ID	[COG2224] Isocitrate lyase
TIGRFAM ID	[TIGR01346] isocitrate lyase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.857815
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.048313
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAACCC GTACACAACA AATTGAAGAA TTACAGAAAG AGTGGACTCA ACCGCGTTGG 
GAAGGCATTA CTCGCCCATA CAGTGCGGAA GATGTGGTGA AATTACGCGG TTCAGTCAAT 
CCTGAATGCA CGCTGGCGCA ACTGGGCGCA GCGAAAATGT GGCGTCTGCT GCACGGTGAG 
TCGAAAAAAG GCTACATCAA CAGCCTCGGC GCACTGACTG GCGGTCAGGC GCTGCAACAG 
GCGAAAGCGG GTATTGAAGC AGTCTATCTG TCGGGATGGC AGGTAGCGGC GGACGCTAAC 
CTGGCGGCCA GCATGTATCC GGATCAGTCG CTCTATCCGG CAAACTCGGT GCCAGCTGTG 
GTGGAGCGGA TCAACAACAC CTTCCGTCGT GCCGATCAGA TCCAATGGTC CGCGGGCATT 
GAGCCGGGCG ATCCGCGCTA TGTCGATTAC TTCCTGCCGA TCGTTGCCGA TGCGGAAGCC 
GGTTTTGGCG GTGTCCTGAA TGCCTTTGAA CTGATGAAAG CGATGATTGA AGCCGGTGCA 
GCGGCAGTTC ACTTCGAAGA TCAGCTGGCG TCAGTGAAGA AATGCGGTCA CATGGGCGGC 
AAAGTTTTAG TGCCAACTCA GGAAGCTATT CAGAAACTGG TCGCGGCGCG TCTGGCAGCT 
GACGTGACGG GCGTTCCAAC CCTGCTGGTT GCCCGTACCG ATGCTGATGC GGCGGATCTG 
ATCACCTCCG ATTGCGACCC GTATGACAGC GAATTTATTA CCGGCGAGCG TACCAGTGAA 
GGCTTCTTCC GTACTCATGC GGGCATTGAG CAAGCGATCA GCCGTGGCCT GGCGTATGCG 
CCATATGCTG ACCTGGTCTG GTGTGAAACC TCCACGCCGG ATCTGGAACT GGCGCGTCGC 
TTTGCACAAG CTATCCACGC GAAATATCCG GGCAAACTGC TGGCTTATAA CTGCTCGCCG 
TCATTCAACT GGCAGAAAAA CCTCGACGAC AAAACTATTG CCAGCTTCCA GCAGCAGCTG 
TCGGATATGG GCTACAAGTT CCAGTTCATC ACCCTGGCAG GTATCCACAG CATGTGGTTC 
AACATGTTTG ACCTGGCAAA CGCCTATGCC CAGGGCGAGG GTATGAAGCA CTACGTTGAG 
AAAGTGCAGC AGCCGGAATT TGCCGCCGCG AAAGATGGCT ATACCTTCGT ATCTCACCAG 
CAGGAAGTGG GTACAGGTTA CTTCGATAAA GTGACGACTA TTATTCAGGG CGGCACGTCG 
TCGGTTACAG CGCTGACCGG CTCCACCGAA GAATCGCAGT TCTAA

Protein sequence

MKTRTQQIEE LQKEWTQPRW EGITRPYSAE DVVKLRGSVN PECTLAQLGA AKMWRLLHGE 
SKKGYINSLG ALTGGQALQQ AKAGIEAVYL SGWQVAADAN LAASMYPDQS LYPANSVPAV 
VERINNTFRR ADQIQWSAGI EPGDPRYVDY FLPIVADAEA GFGGVLNAFE LMKAMIEAGA 
AAVHFEDQLA SVKKCGHMGG KVLVPTQEAI QKLVAARLAA DVTGVPTLLV ARTDADAADL 
ITSDCDPYDS EFITGERTSE GFFRTHAGIE QAISRGLAYA PYADLVWCET STPDLELARR 
FAQAIHAKYP GKLLAYNCSP SFNWQKNLDD KTIASFQQQL SDMGYKFQFI TLAGIHSMWF 
NMFDLANAYA QGEGMKHYVE KVQQPEFAAA KDGYTFVSHQ QEVGTGYFDK VTTIIQGGTS 
SVTALTGSTE ESQF