Gene EcolC_3273 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3273
Symbol
ID	6065774
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	3582158
End bp	3583171
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	57%
IMG OID	641602688
Product	4-hydroxy-2-ketovalerate aldolase
Protein accession	YP_001726222
Protein GI	170021268
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR03217] 4-hydroxy-2-oxovalerate aldolase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.651413
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGGTA AAAAACTTTA TATCTCGGAC GTCACATTGC GTGACGGTAT GCACGCCATT 
CGTCATCAGT ATTCGCTGGA AAACGTTCGC CAGATTGCCA AAGCACTGGA CGATGCCCGC 
GTGGATTCGA TTGAAGTGGC CCACGGCGAC GGTTTGCAAG GTTCCAGCTT TAACTATGGT 
TTCGGCGCAC ATAGCGACCT TGAATGGATT GAAGCGGCGG CGGATGTGGT GAAGCACGCC 
AAAATCGCGA CGTTGTTGCT GCCAGGAATC GGCACTATTC ACGATCTGAA AAATGCCTGG 
CAGGCTGGCG CGCGGGTGGT TCGTGTGGCA ACGCACTGTA CCGAAGCTGA TGTTTCCGCC 
CAGCATATTC AGTATGCCCG CGAGCTCGGA ATGGACACCG TTGGTTTTCT GATGATGAGC 
CATATGACCA CGCCGGAGAA TCTCGCCAAG CAGGCAAAGC TGATGGAAGG CTACGGTGCG 
ACCTGTATTT ATGTGGTGGA TTCTGGCGGT GCGATGAACA TGAGCGATAT CCGTGACCGT 
TTCCGCGCCC TGAAAGCAGA GCTGAAACCA GAAACGCAAA CTGGCATGCA CGCTCACCAT 
AACCTGAGTC TTGGCGTGGC GAACTCTATC GCGGCGGTGG AAGAGGGCTG CGACCGAATC 
GACGCCAGCC TCGCGGGAAT GGGCGCGGGC GCAGGTAACG CACCGCTGGA AGTGTTTATT 
GCCGCCGCGG ATAAACTGGG CTGGCAGCAT GGGACCGATC TCTATGCGTT AATGGATGCC 
GCCGACGACC TGGTGCGTCC GTTGCAGGAT CGACCGGTAC GAGTCGATCG CGAAACGCTG 
GCGCTGGGAT ACGCTGGTGT TTACTCGAGC TTCCTGCGTC ACTGTGAAAC GGCGGCGGCG 
CGTTATGGCT TAAGTGCGGT GGATATTCTC GTTGAGCTGG GCAAACGCCG GATGGTTGGC 
GGCCAGGAGG ATATGATCGT TGACGTGGCG CTGGATCTGC GCAACAACAA ATAA

Protein sequence

MNGKKLYISD VTLRDGMHAI RHQYSLENVR QIAKALDDAR VDSIEVAHGD GLQGSSFNYG 
FGAHSDLEWI EAAADVVKHA KIATLLLPGI GTIHDLKNAW QAGARVVRVA THCTEADVSA 
QHIQYARELG MDTVGFLMMS HMTTPENLAK QAKLMEGYGA TCIYVVDSGG AMNMSDIRDR 
FRALKAELKP ETQTGMHAHH NLSLGVANSI AAVEEGCDRI DASLAGMGAG AGNAPLEVFI 
AAADKLGWQH GTDLYALMDA ADDLVRPLQD RPVRVDRETL ALGYAGVYSS FLRHCETAAA 
RYGLSAVDIL VELGKRRMVG GQEDMIVDVA LDLRNNK