Gene Mflv_4233 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mflv_4233
Symbol
ID	4975546
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium gilvum PYR-GCK
Kingdom	Bacteria
Replicon accession	NC_009338
Strand	-
Start bp	4492323
End bp	4493333
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	67%
IMG OID	640458460
Product	3-isopropylmalate dehydrogenase
Protein accession	YP_001135490
Protein GI	145224812
COG category	[C] Energy production and conversion [E] Amino acid transport and metabolism
COG ID	[COG0473] Isocitrate/isopropylmalate dehydrogenase
TIGRFAM ID	[TIGR00169] 3-isopropylmalate dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.397196
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.260479
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACTCG CGGTGATCGC CGGCGACGGC ATCGGACCCG AAGTCATCGG CGAAGCCCTC 
AGGGTGCTCG ACGCCGTCGT GCCGGGGGTG GAGAAGACCG AGTACGACCT CGGCGCCCGG 
CTGTATCACC GCACAGGTGA GGTGCTGCCC GACTCGGTGC TCGACGAGCT CAAGGGTCAC 
GACGCGATCC TGCTCGGCGC GATCGGCGAT CCGTCGATGC CCAGCGGTGT GCTGGAACGT 
GGCCTGTTGC TGCGCATCCG TTTCGAGCTC GACCACCACA TCAACCTGCG TCCCGGACGT 
CTCTACCCGG GTGTGCAGAG TCCGCTGGCC GGGAATCCCG AGATCGACTT CGTCGTGGTC 
CGGGAGGGCA CCGAGGGTCC GTACACCGGT AACGGCGGCG CGATCCGGGT CGGTACCCCG 
CACGAGATCG CGACCGAGGT CAGTGTCAAC ACCGCCTACG GTGTGCGCCG TGTCGTGCAG 
GACGCGTTCA AGCGTGCCCA GCAGCGGCGC AAGCATCTGA CGTTGGTGCA CAAGAACAAT 
GTGCTGACCA ACGCCGGGTC CCTGTGGTGG CGCACCGTGC AGGCGGTCGC CGCGGAGTAC 
CCGGAGGTCG AGGTCGCCTA CCAGCACGTC GACGCCGCCA CCATTCACAT GGTCACCGAC 
CCGGGCCGCT TCGATGTGAT CGTCACCGAC AACCTGTTCG GCGACATCAT CACCGACCTC 
GCCGCGGCGG TGTGTGGTGG TATCGGCCTG GCGGCCAGCG GCAACATCGA TGCGACGCTG 
ACGAACCCGT CGATGTTCGA ACCCGTGCAC GGCAGCGCGC CCGATATCGC CGGGCAGGGC 
ATCGCTGACC CGACGGCCGC GATCATGTCG GTGTCGCTGC TGCTGGCCCA CATGGCCGAG 
ATCGATGCGG CGGCCCGGGT CGACAAGGCC GTCGCCGAGC ACCTGGCCAC CCGCGGGGAC 
GAGAAGCTCT CGACCACTCA GGTGGGCGAT CGGATCCTCG GAAAGCTGTA G

Protein sequence

MKLAVIAGDG IGPEVIGEAL RVLDAVVPGV EKTEYDLGAR LYHRTGEVLP DSVLDELKGH 
DAILLGAIGD PSMPSGVLER GLLLRIRFEL DHHINLRPGR LYPGVQSPLA GNPEIDFVVV 
REGTEGPYTG NGGAIRVGTP HEIATEVSVN TAYGVRRVVQ DAFKRAQQRR KHLTLVHKNN 
VLTNAGSLWW RTVQAVAAEY PEVEVAYQHV DAATIHMVTD PGRFDVIVTD NLFGDIITDL 
AAAVCGGIGL AASGNIDATL TNPSMFEPVH GSAPDIAGQG IADPTAAIMS VSLLLAHMAE 
IDAAARVDKA VAEHLATRGD EKLSTTQVGD RILGKL