Gene GM21_3353 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3353
Symbol
ID	8138720
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	3880134
End bp	3881222
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	62%
IMG OID	644870971
Product	3-isopropylmalate dehydrogenase
Protein accession	YP_003023136
Protein GI	253701947
COG category	[C] Energy production and conversion [E] Amino acid transport and metabolism
COG ID	[COG0473] Isocitrate/isopropylmalate dehydrogenase
TIGRFAM ID	[TIGR00169] 3-isopropylmalate dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	67
Fosmid unclonability p-value	0.133211
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGAAAGC TTTTTAAAGT GGCGGTATTG CCAGGAGACG GCATAGGTCC CGAGGTTATG 
GCGGAAGCAC TGAGGGTGCT CGATGCGGTT GAGAAACGTT ACGAAGTCAC TTTCGAGCGG 
ACCCACGCCA ACGTAGGCGG AGCGGGCATC GACCTGGAAG GTCGTGCGCT TCCCGAGACC 
ACGGTAAATA TATGCAAGGC TTCGGACGCC ATCCTTTTCG GCTCCGTAGG CGGACCCAAG 
TGGGAAACCC TTCCCCCGGA CGAGCAGCCC GAGCGCGGCG CCCTGCTGCC GCTTCGCAAG 
ATCTTCGGCC TCTACGCCAA CCTGCGTCCG GCCATCATCT TCCCGTCGCT CACCAGCGCC 
TCCTCGCTGA AGGAAGAGGT GATCGCAGGG GGCTTCGACA TCCTGGTGAT CCGCGAATTG 
ACCGGCGGCA TCTACTTCTC CCAGCCCAAA GGGATCGAAG GCGAGGGGCG CAACCGCGTC 
GGCGTCGACA CCATGCGCTA CAGCGTCCCC GAGATCGAGC GCATCGCGCA CGTGGCCTTC 
CAGGCGGCGA GAAAGCGCGG CAAGAAGGTC TGCTCCATCG ACAAGGCCAA CGTTCTTTCC 
AGCTCCGTCC TTTGGCGCGA GATAGTGATC AACATCGCCA ACGAATACCC GGACGTCGAG 
CTCTCCCACA TGTACGTGGA CAACGCCGCG ATGCAGCTCG TTAAGTGGCC CAAGCAGTTC 
GACGTGATCC TTTGCGAGAA CATGTTCGGC GACATTCTCT CGGACGAGGC GGCCATGCTG 
ACCGGCTCTT TGGGGATGCT TCCCTCCGCC TCGCTGGCCG AGGGGACCTT CGGCATGTAC 
GAGCCCTCCG GCGGGAGCGC CCCGGACATC GCAGGGCAGG GGATCGCCAA CCCGATCGCC 
CAGATCCTCT CCGCGGGGAT GATGCTCCGT TACTCCTTCG GCATGATCGA GGCGGCCGAC 
GCCATCGACA ACGCCGTCGC CAAGGTACTC GACGGCGGTT TCCGCACCAG GGACATCTAT 
CAGGAGAAGG CAGGCGAGAA GCTGGTGAAC ACCAAGGAGA TCGGCGACGC CATCATCGCC 
AATCTCTGA

Protein sequence

MGKLFKVAVL PGDGIGPEVM AEALRVLDAV EKRYEVTFER THANVGGAGI DLEGRALPET 
TVNICKASDA ILFGSVGGPK WETLPPDEQP ERGALLPLRK IFGLYANLRP AIIFPSLTSA 
SSLKEEVIAG GFDILVIREL TGGIYFSQPK GIEGEGRNRV GVDTMRYSVP EIERIAHVAF 
QAARKRGKKV CSIDKANVLS SSVLWREIVI NIANEYPDVE LSHMYVDNAA MQLVKWPKQF 
DVILCENMFG DILSDEAAML TGSLGMLPSA SLAEGTFGMY EPSGGSAPDI AGQGIANPIA 
QILSAGMMLR YSFGMIEAAD AIDNAVAKVL DGGFRTRDIY QEKAGEKLVN TKEIGDAIIA 
NL