Gene Mpe_A2164 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A2164
Symbol
ID	4784853
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	-
Start bp	2321520
End bp	2322959
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	68%
IMG OID	640090732
Product	isopropylmalate isomerase large subunit
Protein accession	YP_001021355
Protein GI	124267351
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0065] 3-isopropylmalate dehydratase large subunit
TIGRFAM ID	[TIGR00170] 3-isopropylmalate dehydratase, large subunit

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.170701
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGTTGTTGA CGCCTAAAAT CGAGGCCATG GGACGCACTC TGTACGACAA GCTGTGGGAC 
GAACACGTCG TCCACTCCGA GGACGACGGC ACCGCCGTGC TCTACATCGA CCGACACCTG 
GTGCACGAGG TGACGAGCCC GCAGGCCTTC GAAGGCTTGG ACCTCGCCGG CCGCAAGATC 
TGGCGACTTT CGGCCAATCT GGCGGTGAGC GACCACAACG TGCCGACCAC CGACCGATCC 
CGGGGCATCG CCGACCCGGT GTCGCGCCTG CAGGTCGACA CGCTGGACGC CAACTGCGAC 
CGCTTCGGCA TCACGCAGTT CAAGATGAAC GATCGTCGCC AGGGCATCGT GCACGTGATC 
GGGCCGGAGC AGGGCGCCAC GCTGCCGGGC ATGACGGTGG TGTGCGGTGA TTCGCACACC 
AGCACCCACG GCGCCTTCGG TGCGCTGGCG CATGGCATCG GCACCAGCGA GGTCGAGCAC 
GTGCTTGCGA CTCAGACGCT GCTCGCCAAG AAGGCGAAGA ACCTGCTGGT GCGGGTGGAC 
GGCGTGCTAC CGGCCGGCTG CAGCGCCAAG GACATCGTGC TGGCGATCAT CGGTCGCATC 
GGCACGGCCG GCGGCAACGG CCATACCATC GAGTTCGGTG GCTCGGCGAT TCGCGCGCTG 
AGCATGGAAG GCCGCATGAC GGTGTGCAAC ATGGCCATCG AGGCCGGCGC GAGGGCCGGC 
CTGGTCGCGG TGGACGACAC GACGATCCAG TACGTGAAGG GGCGGCCGTT CTCGCCGTCA 
GGTGTGGAGT GGGAGCACGC GGTCGCCTAC TGGCGCACGC TGCATTCCGA CGAGGATGCC 
GTCTTTGATC GCGTGGTCGA ACTCGATGCG GGTCAGATCG CACCGCAGGT CACCTGGGGC 
ACCTCGCCCG AGATGGTGCT TTCGATCAAC GACCGGGTGC CCGATCCGGA CCGCGAGAAG 
GATGCTGGCA AGCGCGGCGC CATCGAGCGC GCGCTGACCT ACATGTCGCT CGAGCCGAAC 
AAGCCGATCG GTGACATCCG CATCGACAAG GTGTTCATCG GCTCGTGTAC CAACTCCCGC 
ATCGAGGACC TGCGCGAGGC CGCCGCGGTG GTGCGGCGCG TCGGCGGGCG CATCGCCGGC 
AACGTGAAGC TGGCGCTGGT CGTGCCGGGT TCCGGGCTGG TCAAGGCGCA GGCCGAGCGC 
GAAGGGCTCG ATGCGGTGTT CAAGGCGGCC GGCTTCGAAT GGCGGGAGCC GGGCTGCTCG 
ATGTGCCTGG CGATGAACGC CGACCGCCTC GAGCCCGGAG AACGGTGCGC GTCTACCAGC 
AACCGCAACT TCGAGGGTCG CCAGGGCGCC GGCGGCCGCA CGCACCTCGT GAGCCCCGCG 
ATGGCCGCCG CCGCCGCCAT GGAAGGGCAT TTCGTCGACG TCCGGCGCAT TGCCGCCTGA

Protein sequence

MLLTPKIEAM GRTLYDKLWD EHVVHSEDDG TAVLYIDRHL VHEVTSPQAF EGLDLAGRKI 
WRLSANLAVS DHNVPTTDRS RGIADPVSRL QVDTLDANCD RFGITQFKMN DRRQGIVHVI 
GPEQGATLPG MTVVCGDSHT STHGAFGALA HGIGTSEVEH VLATQTLLAK KAKNLLVRVD 
GVLPAGCSAK DIVLAIIGRI GTAGGNGHTI EFGGSAIRAL SMEGRMTVCN MAIEAGARAG 
LVAVDDTTIQ YVKGRPFSPS GVEWEHAVAY WRTLHSDEDA VFDRVVELDA GQIAPQVTWG 
TSPEMVLSIN DRVPDPDREK DAGKRGAIER ALTYMSLEPN KPIGDIRIDK VFIGSCTNSR 
IEDLREAAAV VRRVGGRIAG NVKLALVVPG SGLVKAQAER EGLDAVFKAA GFEWREPGCS 
MCLAMNADRL EPGERCASTS NRNFEGRQGA GGRTHLVSPA MAAAAAMEGH FVDVRRIAA