Gene EcolC_3585 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3585
Symbol
ID	6066420
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	3918717
End bp	3920117
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	56%
IMG OID	641603002
Product	isopropylmalate isomerase large subunit
Protein accession	YP_001726526
Protein GI	170021572
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0065] 3-isopropylmalate dehydratase large subunit
TIGRFAM ID	[TIGR00170] 3-isopropylmalate dehydratase, large subunit

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000478946
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCTAAAA CGTTATACGA AAAATTGTTC GACGCTCACG TTGTGTACGA AGCCGAAAAC 
GAAACCCCAC TGTTATATAT CGACCGCCAC CTGGTGCATG AAGTGACCTC ACCGCAGGCG 
TTCGATGGTC TGCGCGCCCA CGGTCGCCCG GTACGTCAGC CGGGCAAAAC CTTCGCTACC 
ATGGATCACA ACGTCTCTAC CCAGACCAAA GACATTAATG CCTGCGGTGA AATGGCGCGT 
ATCCAGATGC AGGAACTGAT CAAAAACTGC AAAGAATTTG GCGTCGAACT GTATGACCTG 
AATCACCCGT ATCAGGGGAT CGTCCACGTA ATGGGGCCGG AACAGGGCGT CACCTTGCCG 
GGGATGACCA TTGTCTGCGG CGACTCGCAT ACCGCCACCC ACGGCGCGTT TGGCGCACTG 
GCCTTTGGTA TCGGCACTTC CGAAGTTGAA CACGTACTGG CAACGCAAAC CCTGAAACAG 
GGCCGCGCAA AAACCATGAA AATTGAAGTC CAGGGCAAAG CCGCGCCGGG CATTACCGCA 
AAAGATATCG TGCTGGCAAT TATCGGTAAA ACCGGTAGCG CAGGCGGCAC CGGGCATGTG 
GTGGAGTTTT GCGGCGAAGC AATCCGTGAT TTAAGCATGG AAGGTCGTAT GACCCTGTGC 
AATATGGCAA TCGAAATGGG CGCAAAAGCC GGTCTGGTTG CACCGGACGA AACCACCTTT 
AACTATGTCA AAGGCCGTCT GCATGCGCCG AAAGGCAAAG ATTTCGACGA CGCCATTGCC 
TACTGGAAAA CCCTGCAAAC CGACGAAGGC GCAACTTTCG ATACCGTTGT CACTCTGCAA 
GCAGAAGAAA TTTCACCGCA GGTCACCTGG GGCACCAATC CCGGCCAGGT GATTTCCGTG 
AACGACAATA TTCCCGATCC GGCTTCGTTT GCCGATCCGG TTGAACGTGC GTCGGCAGAA 
AAAGCGCTGG CCTATATGGG GCTGAAACCG GGTATTCCGC TGACCGAAGT GGCTATCGAC 
AAAGTGTTTA TCGGTTCCTG TACCAACTCG CGCATTGAAG ATTTACGCGC GGCAGCGGAG 
ATCGCCAAAG GGCGAAAAGT CGCGCCAGGC GTGCAGGCAC TGGTGGTTCC CGGCTCTGGC 
CCGGTAAAAG CCCAGGCGGA AGCGGAAGGT CTGGATAAAA TCTTTATTGA AGCCGGTTTT 
GAATGGCGCT TACCTGGCTG CTCAATGTGT CTGGCGATGA ACAACGACCG GCTGAATCCG 
GGCGAACGTT GTGCCTCCAC CAGCAACCGT AACTTTGAAG GCCGCCAGGG GCGCGGCGGG 
CGCACGCATC TGGTCAGCCC GGCAATGGCT GCCGCCGCGG CTGTGACCGG CCATTTCGCC 
GACATTCGCA ACATTAAATA A

Protein sequence

MAKTLYEKLF DAHVVYEAEN ETPLLYIDRH LVHEVTSPQA FDGLRAHGRP VRQPGKTFAT 
MDHNVSTQTK DINACGEMAR IQMQELIKNC KEFGVELYDL NHPYQGIVHV MGPEQGVTLP 
GMTIVCGDSH TATHGAFGAL AFGIGTSEVE HVLATQTLKQ GRAKTMKIEV QGKAAPGITA 
KDIVLAIIGK TGSAGGTGHV VEFCGEAIRD LSMEGRMTLC NMAIEMGAKA GLVAPDETTF 
NYVKGRLHAP KGKDFDDAIA YWKTLQTDEG ATFDTVVTLQ AEEISPQVTW GTNPGQVISV 
NDNIPDPASF ADPVERASAE KALAYMGLKP GIPLTEVAID KVFIGSCTNS RIEDLRAAAE 
IAKGRKVAPG VQALVVPGSG PVKAQAEAEG LDKIFIEAGF EWRLPGCSMC LAMNNDRLNP 
GERCASTSNR NFEGRQGRGG RTHLVSPAMA AAAAVTGHFA DIRNIK