Gene Acid345_2964 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2964
Symbol
ID	4068865
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	3508813
End bp	3510024
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	57%
IMG OID	637984983
Product	3-isopropylmalate dehydrogenase
Protein accession	YP_592039
Protein GI	94969991
COG category	[C] Energy production and conversion [E] Amino acid transport and metabolism
COG ID	[COG0473] Isocitrate/isopropylmalate dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.622363
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.574229
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTCGTC CAACTGTAGT GACAATGCCC GGCGATGGGA TCGGGAACCA GGTTTTGCCG 
CAGGCGATTC GCGTCCTTGA AGCGGTGGGC TTCGAGGCTA ACTACGTGCA TGCCGATATC 
GGCTGGGAGT GCTGGTGCAA CGAAGGCAAT GCACTGCCGG ACCGTACCAT TCAACTGTTG 
CGTAAGCACA AGCTCGGTCT GTTCGGCGCG ATCACGAGTA AGCCGAAGAA GGCTGCCGAT 
GCCGAATTGA AGCCCGAACT TCGCGGCAAA GGCCTCTCGT ACTTCAGTCC GATCGTGACC 
ATGCGGCAGT TGTTCAATCT CGACGTGTGC ATGCGGCCTT GCTTGTCGTT TCCGGGAAAT 
CCGCTGAATT TCATCCGTCA AACAACGTGC GGTGGATTTG AAGAGCCGCA GGTGGATGTC 
GTCGTTTTCC GGCAAAACAC CGAAGGATTG TACGCGGGCG TGGAGTGGAC GAATCCACCG 
GAGAACGTGC GTACTGCGCT GGCATCGCAT AAGAAGTTCG CGGCCTTCGC GAATACACCG 
GGTGAAGAAC TGGCGGTGTC GGTGCGCATT ATCACTAAGA AGAATGCGCA ACGGATTTGC 
GAGGCGGCAT TCAAGCACGC GAAGAAATAC CGCTACAAGA ACGTGACCAT CTGTGAGAAG 
CCGAACGTGC TGCGCGAGAC GAGCGGCATG ATGGAAGAAG TGGCGAAGCA GGTACAGAAA 
CAGTATCCGG AGATCGCATT GTGGTCCACG AACATTGACG CGCAAACAAT GTGGCTGACG 
AAGAACCCTG AAGAGTATGG GGTGATCGTG GCCAGCAACC TGTTTGGCGA TGTGATTTCC 
GACGCGTTCG CGGGACTCGT GGGTGGGTTG GGATTTGCGG CGAGCGGCAA TATCGGCGAT 
GAAGTCGCGG TGTTTGAGCC GACGCATGGA TCGGCGCCGA AGTATGCCGA GTTAAATCCG 
TCGATCGTAA ATCCGATCGC GATGATCCTG TCGGCAGCGA TGATGCTCGA CCACATCGGC 
GAGAGCGAGA AAGCAGATCG GATCCGGAAG GCGATTGCTG ACGTGGTGAA AGAAGGCAAG 
GTTCGGACCT ACGACATGAT GCGGATTGCG GGCGGGCCGA AGTCGCTGGC GCAGGGCGCG 
GCGAATACGG TCCAAATAAC GGATGCGATT TTGGTGCATG TGGAGACTGC GATCGCAGCT 
TTCGCGCGCT AG

Protein sequence

MARPTVVTMP GDGIGNQVLP QAIRVLEAVG FEANYVHADI GWECWCNEGN ALPDRTIQLL 
RKHKLGLFGA ITSKPKKAAD AELKPELRGK GLSYFSPIVT MRQLFNLDVC MRPCLSFPGN 
PLNFIRQTTC GGFEEPQVDV VVFRQNTEGL YAGVEWTNPP ENVRTALASH KKFAAFANTP 
GEELAVSVRI ITKKNAQRIC EAAFKHAKKY RYKNVTICEK PNVLRETSGM MEEVAKQVQK 
QYPEIALWST NIDAQTMWLT KNPEEYGVIV ASNLFGDVIS DAFAGLVGGL GFAASGNIGD 
EVAVFEPTHG SAPKYAELNP SIVNPIAMIL SAAMMLDHIG ESEKADRIRK AIADVVKEGK 
VRTYDMMRIA GGPKSLAQGA ANTVQITDAI LVHVETAIAA FAR