Gene Mpe_A2101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A2101
Symbol
ID	4784320
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	-
Start bp	2248269
End bp	2249810
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	65%
IMG OID	640090669
Product	2-isopropylmalate synthase
Protein accession	YP_001021292
Protein GI	124267288
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR00973] 2-isopropylmalate synthase, bacterial type

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0462257
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.390804
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGACA AGCTCATCAT CTTCGACACC ACCTTGCGCG ACGGCGAACA GTCGCCCGGC 
GCCTCCATGA CCAAGGATGA GAAGCTGCGC ATCGCGCGCC AGCTGGAGCG TTTGCGGGTC 
GACGTGATCG AGGCGGGTTT CGCGGCGTCG AGCAACGGCG ACTTCGAGGC GGTCCGGGCG 
ATTGCCGACG TGATCAAGGA ATCGACCGTG TGCTCGCTGG CGCGCGCCAA TGACCGCGAC 
ATCGCGCGGG CGGCCGAGGC GCTGAAGAGC GCTGCGCGTT CTCGCATCCA CACCTTCATC 
GCGACCAGTG AACTGCACAT GGAGAAGAAG TTGCGGATGA CGCGCGAGCA GGTGCTGGAG 
CAGGCCAGGC TGTCGATTCG CTTCGCCCGC AACCTGTGCG AGGACATCGA GTTTTCGCCG 
GAGGATGGCT ACCGGTCCGA CCCGGACTTC CTGTGCCGTG TGATCGAGGC CGTGATCAAC 
GAGGGCGCGA CCACCATCAA CGTGCCCGAC ACCGTCGGAT ACGGCATCCC CGAGCTGTAC 
GGCAATTTCA TCAGGACCTT GCGGGAGCGG GTGCCGAATT CGGACAAGGC GGTCTGGTCG 
GTTCACTGCC ACAACGACCT CGGTATGGCG GTGGCGAACT CGTTGGCTGG CGTGAAGATC 
GGGGGTGCCC GCCAGATCGA ATGCACGATC AATGGGCTCG GCGAGCGCGC AGGCAACTGC 
TCGCTCGAGG AAGTCGTGAT GGCGGTTCGC ACGCGGCGCG ACCATTTCGG GCTCGAAGTG 
GGCATCGATA CCACGCAGAT CGTGCCGGCT TCGCGGCTGG TGTCGCAGAC GACTGGCTTC 
ATCGTGCAGC CGAACAAGGC GGTCGTCGGC GCAAATGCCT TCGCGCACGC CTCCGGTATC 
CACCAGGACG GCGTCCTGAA GGCGCGCGAC ACCTACGAGA TCATGCGCGC CGAGGACGTG 
GGCTGGAGTG CCAACAAGAT CGTGCTCGGC AAGCTCAGCG GCCGGAACGC CTTCAAGCAG 
CGCCTGCAGG AGCTCGGAAT CGAGCTCGAG TCCGAGACCG ACGTCAACGC GGCCTTTGCG 
CGCTTCAAGG ATCTGGCCGA TCGCAAGAGC GACATCTTCG ACGAAGACAT CATCGCGCTG 
GTCGGCGATG AGAGCGTGAC CCACGAGCAG GAGACGTACC GGCTGCTCTC GCTGGAGCAG 
CAATCGGCGA CTGGGGAGCG TCCGCATGCG AAGGTGGCTT TCGCGGTCGG AGAGACCGAG 
TTCCATGCCG AGAGCGAAGG CAACGGGCCG GTCGACGCGA GTCTCAAGGC CATCGAGTCG 
AAGCTGAAAA GCGGCGCAGA AATGCTGCTC TATTCGGTCA ATGCCATCAC CTCGGGCAGC 
ACAGAATCCC AGGGCGAGGT GACTGTGCGG CTGCAGCACG GCGGACGGGT GGTGAATGGC 
GTGGGGGCGG ACCCGGACAT CGTGGTGGCC TCGGCCAAGG CCTACCTGTC GGCCCTGAAC 
AAGCTGCACA GCAAGAACGA GCGCGTCGCC GCCCAGGGGT AA

Protein sequence

MADKLIIFDT TLRDGEQSPG ASMTKDEKLR IARQLERLRV DVIEAGFAAS SNGDFEAVRA 
IADVIKESTV CSLARANDRD IARAAEALKS AARSRIHTFI ATSELHMEKK LRMTREQVLE 
QARLSIRFAR NLCEDIEFSP EDGYRSDPDF LCRVIEAVIN EGATTINVPD TVGYGIPELY 
GNFIRTLRER VPNSDKAVWS VHCHNDLGMA VANSLAGVKI GGARQIECTI NGLGERAGNC 
SLEEVVMAVR TRRDHFGLEV GIDTTQIVPA SRLVSQTTGF IVQPNKAVVG ANAFAHASGI 
HQDGVLKARD TYEIMRAEDV GWSANKIVLG KLSGRNAFKQ RLQELGIELE SETDVNAAFA 
RFKDLADRKS DIFDEDIIAL VGDESVTHEQ ETYRLLSLEQ QSATGERPHA KVAFAVGETE 
FHAESEGNGP VDASLKAIES KLKSGAEMLL YSVNAITSGS TESQGEVTVR LQHGGRVVNG 
VGADPDIVVA SAKAYLSALN KLHSKNERVA AQG