Gene Acid345_4042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4042
Symbol
ID	4072463
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	4775613
End bp	4776659
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	60%
IMG OID	637986072
Product	isocitrate dehydrogenase (NAD+)
Protein accession	YP_593116
Protein GI	94971068
COG category	[C] Energy production and conversion [E] Amino acid transport and metabolism
COG ID	[COG0473] Isocitrate/isopropylmalate dehydrogenase
TIGRFAM ID	[TIGR00175] isocitrate dehydrogenase, NAD-dependent, mitochondrial type [TIGR00183] isocitrate dehydrogenase, NADP-dependent, prokaryotic type [TIGR02088] isopropylmalate/isohomocitrate dehydrogenases

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTACA AGATCACACT CATTCCCGGC GACGGCATCG GCCCTGAAGT CACCTCCGCT 
GCCGTGCGCG TCCTCGAAGC CACCGGACTC AAGTTCGAGT GGGAAAGCTT CGCCGCCGGC 
GCCGAGGCCT ACGAAAAATA CAAGGAATAC ATCCCGAAAG AACTGAACGA ATCCATCGAG 
CGCACCAGGA TCGGCCTCAA GGGTCCAGTC ACCACTCCGA TCGGTGGCGG ATTCTCCAGC 
ATCAACGTTG AACTGCGCAA GCGCTTCGAG CTCTACGCGA ACGTCCGGCC AATCCGCAAT 
CTTCCAGGCG TGCACACTCG TTATCCCGGC GTCGATCTCG TCGTGGTGCG CGAGAACACC 
GAAGGCCTCT ACTCCGGCAT CGAGCACGAA GTTGTCCCCG GCGTAGTCGA GAGCCTGAAG 
ATCATCACCG AGAAGGCCAG CACCCGCATC TCCAAGTTCG CGTTCAACTA CGCGCGCAAG 
ATGGGCCGCA AGAAGATCCA CTCCATCCAC AAAGCCAACA TCATGAAGAT GTCCGATGGC 
CTCTTCATCC GCTGCTCGCG CAACATCTCG AAGGAATATC CCGAGATCAT CTACGGCGAG 
CACATTGTGG ACAACACCTG CATGCAACTG GTGATGAACC CCTACCAGTA CGACATCCTG 
CTCCTCGAAA ATCTCTATGG CGACATTGTC AGTGACCTCT GCGCCGGATT AGTCGGCGGC 
CTCGGCCTCG CTCCCGGCGC CAACATCGGC GAACGCGCGA GCATCTTTGA AGCCGTTCAC 
GGCTCCGCTC CCGACATCGC GGGCAAGAAC ATCGCCAATC CCACGGCTGT CATCCGCAGC 
GGCATCCTCA TGCTCCGCCA CCTCGACGAG CAGGACGCCG CCAACCGCGT CAAAGCCGCC 
GTCCACCACG TCTACCGCGA AGGCAAACAC CTCACCAGGG ACATGGGTGG CACTACGTCC 
ACCAGCGAAT TCGCCGATAA AGTCGTCGAG GCCATCCACA GCAAAGACCT CGTCGTCCCC 
GCACCGCCGG TACAAAGTCC AGCGTAA

Protein sequence

MTYKITLIPG DGIGPEVTSA AVRVLEATGL KFEWESFAAG AEAYEKYKEY IPKELNESIE 
RTRIGLKGPV TTPIGGGFSS INVELRKRFE LYANVRPIRN LPGVHTRYPG VDLVVVRENT 
EGLYSGIEHE VVPGVVESLK IITEKASTRI SKFAFNYARK MGRKKIHSIH KANIMKMSDG 
LFIRCSRNIS KEYPEIIYGE HIVDNTCMQL VMNPYQYDIL LLENLYGDIV SDLCAGLVGG 
LGLAPGANIG ERASIFEAVH GSAPDIAGKN IANPTAVIRS GILMLRHLDE QDAANRVKAA 
VHHVYREGKH LTRDMGGTTS TSEFADKVVE AIHSKDLVVP APPVQSPA