Gene Acid345_4304 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4304
Symbol
ID	4071877
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	5113843
End bp	5115258
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	59%
IMG OID	637986337
Product	dihydrolipoamide dehydrogenase
Protein accession	YP_593378
Protein GI	94971330
COG category	[C] Energy production and conversion
COG ID	[COG1249] Pyruvate/2-oxoglutarate dehydrogenase complex, dihydrolipoamide dehydrogenase (E3) component, and related enzymes
TIGRFAM ID	[TIGR01350] dihydrolipoamide dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCCAGACA CAATTTATGA CGTTGTCATC ATCGGCAGCG GCCCGGCCGG TTATACGGCC 
GCGATCCGCG CCGGCCAATT TGGACTGAAA ACTGCCCTCA TCGAAAAGGA CGCGAAGCTT 
GGCGGCACTT GCCTGCACGT CGGGTGCATC CCGACCAAGT CGCTGCTCTT CAATGCCGAG 
ATTTACGACC ACATTAAGGA AGCCGAGGAG TTCGGCATCG AAGGTTTAGG AACTCCGAAA 
CTGAACTGGA GCAAAGTCCA GGAGCGTAAG CAGGCCATTA TCGACAAGCA TGCCAAGGGC 
CTGCAGTTCC TGATGAAAAA GAACAAGGTC ACGGTGATCC CGGGCTTCGG ACGTCTTACC 
GGCCCGGCGA AGGGCGGCAT TCATAGCGTC GAAGTGGAAG CCGACGGCAA GAAGCAGAAC 
GTGCAGGCGA AGAATGTGCT GCTCTCTACG GGATCGGTAG CGCGCATGTT GCCCGGCTTG 
CAGGCGGACG ACCGTATCCT CACCAACATC GAGATCCTCT CGCTGAAAGA GATTCCGAAG 
TCGCTCGTCG TCATAGGCTC GGGCGCAGTG GGCGTGGAGT TTGCCTCGAT CTACAAATCG 
TTTGGCACCG ACTGCACGAT CATCGAGATG TTGCCGCGGC TCGTTCCGGT GGAAGACGAA 
GAAGTCTCGA AGGAATTGCT GCGTAACTAC AAGAAGCGTG GCATCAACTG CCACGTGAAC 
GCCAAGACCG ACAAGTTCGA GAAGACAAAG ACTGGTGTAA AGGTCACGTT CACTGTCGAC 
GGAAAGCAAG AATCCATCGA GGCCGAGAAG TGTTTGGTCG CGATCGGCCG CGCACCGCGC 
ACCGAGGGCG TCGGCATCGA AAAGACCAAC ATCAAGCTCG AACGCGGCTT TGTGCCGGTG 
AACGAGTGGA TGCAGACCAC GGAACCGGGC GTTTACGCGA TCGGCGATAT CGTGCTCGGC 
CTCCAACAAC TTGCTCACGC GGGTGCGATG GAAGGCATGG TCGCGGTGGC ACACATCGCC 
GGCAAACCGA CCAAGCCGGT GCGAAAAGAC CGCGTGCCCG GCGCGACCTA CTGCCATCCT 
GAGATCGGCA GCGTCGGCCT CACTGAGGCG CAGGCGAAGG AAGCCGGCCA CGAAGTGAAG 
ATCGGCAAAT TCCCCTTCAC TGCCAACTCG CGCGCCTCGA TCGTGAACCA GCACGAGGGC 
TTCGTGAAGG TCGTCGCCGA CGCCAAGCAC GGCGAGATTC TCGGCGTACA CATCATCGGA 
CCGCAAGCTA CGGAACTCGT CGCCGAAGCG GTTGCCATGC TCGAATTGGA AGCCACGGCC 
GATTTCATGA TGACCGTGAT CCACGCCCAT CCAACGCTAG CGGAAGCCAT GCTGGATGCG 
GTGAGCGCGG TGTATGGGAT GGCGATCAAC GCCTAA

Protein sequence

MPDTIYDVVI IGSGPAGYTA AIRAGQFGLK TALIEKDAKL GGTCLHVGCI PTKSLLFNAE 
IYDHIKEAEE FGIEGLGTPK LNWSKVQERK QAIIDKHAKG LQFLMKKNKV TVIPGFGRLT 
GPAKGGIHSV EVEADGKKQN VQAKNVLLST GSVARMLPGL QADDRILTNI EILSLKEIPK 
SLVVIGSGAV GVEFASIYKS FGTDCTIIEM LPRLVPVEDE EVSKELLRNY KKRGINCHVN 
AKTDKFEKTK TGVKVTFTVD GKQESIEAEK CLVAIGRAPR TEGVGIEKTN IKLERGFVPV 
NEWMQTTEPG VYAIGDIVLG LQQLAHAGAM EGMVAVAHIA GKPTKPVRKD RVPGATYCHP 
EIGSVGLTEA QAKEAGHEVK IGKFPFTANS RASIVNQHEG FVKVVADAKH GEILGVHIIG 
PQATELVAEA VAMLELEATA DFMMTVIHAH PTLAEAMLDA VSAVYGMAIN A