Gene Acid345_2791 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2791
Symbol
ID	4072414
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	3303505
End bp	3305352
Gene Length	1848 bp
Protein Length	615 aa
Translation table	11
GC content	61%
IMG OID	637984809
Product	dihydrolipoamide acetyltransferase
Protein accession	YP_591866
Protein GI	94969818
COG category	[C] Energy production and conversion
COG ID	[COG0508] Pyruvate/2-oxoglutarate dehydrogenase complex, dihydrolipoamide acyltransferase (E2) component, and related enzymes
TIGRFAM ID	[TIGR01348] pyruvate dehydrogenase complex dihydrolipoamide acetyltransferase, long form

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.319819
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCACAGG AATTTAAACT CCCCGAACTG GGTGAGAATA TTGCCAGCGG CGACCTGGTT 
CGTGTGATGG TGAAGCCCGG CGACACCGTC AAGGAAGGCC AGCCTGTGAT CGAACTCGAG 
ACGGACAAGG CCGTCATCGA AGTTCCTTCC ACCGTCAGCG GCAAGGTACA GGAAGTCAAA 
GTCCAAAAAG GCCAGAAGCT GAAAGTCGGC GCCATCATCT TCACCTATGG CGACGGCGCG 
GCCGCCGCCC CGGTGCAGCC CGCGGCTCCT GCAAAGACCG AAGACAAACC CAAGGCCGAG 
CCTAAGGCTG AAGCACCCAA GCAAGCTGCG CCTTCTGCTG CAAAACCTGC CGCGAGCACC 
GGCACAAAAC AAACGATCGA GTTCAAGCTT CCGGAACTAG GCGAGAACAT AAAGCAAGGC 
CAGCTCGTCC GCATCATCGC TAAGCAAGGT GCGAGTGTCA GCGACGGCCA ACCGATCCTC 
GAACTTGAAA CCGACAAAGC TGTCATCGAA GTTCCCGCCA CATTGACCGG CACCATCAAA 
GAAGTGCATG TGAAGGAAGG CGACAAGATC GGCGTTGGCC AAACGATCTT CACCGTCGAA 
ACCACCGAGG GTAACACCCA GCCGCCACAT CCACACACCA ACACCGAGGG CAACACGCAA 
CCGCCCACCG GCGGCGGCGC TTCCTCGAAC ACGGAAGGCA ATACTCAGCC CCCGCATCCG 
CACTCCAACA CCGAAGGCAA TCCACAGCCG CCCACTGGCG GCGGTGGATC TTCTTCCGCG 
ACCGCTGCTC GCGACTTCGA ACTCAGCGGA CAGCAACTTG CTCGCCTTCA GTTCGAACTC 
GCTCTGCGCA GCGAAGGCAA AACCGAACGC GAGGCGCATC CGCCCGACGT TCGTGATCTT 
GGCGTGCGGG TCTCTCTCAC GCCACTGACG CCGGGCCGTC CCACTGTCGC CGCGTCGCCC 
ACGGTACGCC GTCTCGCTCG CGAAATCGGC GTCGACATCG TGCAGGTGAA GGGAACCGGT 
CCCGGCGGAC GCATCAGCGA AGGGGATGTA AAGCTCTTCG CAAAGCAACT GATCGTGCGC 
CTCCAGCACG AAGCCGCTAC CGCGAAGGCC GCTCCCAAGG TCGTGCTCCC CGACTTCAGC 
AAGTGGGGCT CGATCGAGAA AGAGCAGATG CGCAGCATTC GGCGCAAAAC TGCTGAGCGT 
CTCACGCAGG CCTGGACCAC CATCCCGCAC GTTACTCAGC ACGACCGCGC TGATATCACC 
GAGCTCGAAA AGCTGCGCGA GAAGTTCGCG AAGCAAGCCG AAGCCGCGGG TGGCAAGCTC 
ACAGTCACGG CCATCGCGCT CAAAGTCATT GCTGCCGCGA TGAAGAAGTT CCCCAAGTTC 
AACGCGTCCA TCGATATCGA TCGCGAAGAA ATTATCTATA AGAAGTACGT GCACATCGGC 
GTCGCCGTTG ACACTGAAGC CGGACTCCTC GTTCCCGTAC TTCGCAACGT GGACCAGAAA 
AACGTCTATC AGATCGCGGC CGAGATGAAC GAACTCTCGA AGCGCGCGCG CGAACGCAAG 
CTCAAGCCGG AAGAGATGGA AGGTGGCACC TTCACCATCA CCAACCTCGG TGGCATTGGC 
GGCACATCAT TCACGCCGAT CGTGAACCTC CCCGAGGTTG CCATCCTGGG CCTCTCGCGC 
GGACGCACTG AGCCCGTGTG GGTCAACGAT CACTTCGAGC CCCGGACGAT GCTCCCGCTC 
TCGCTCAGCT ACGACCACCG CATCATTGAT GGTGCCGACG CCGCCCGCTA CCTTCGCTGG 
GTCGCTGACG CGCTCGAACA ACCGGTGCTG CTGCTCCTGC AAGGTTGA

Protein sequence

MAQEFKLPEL GENIASGDLV RVMVKPGDTV KEGQPVIELE TDKAVIEVPS TVSGKVQEVK 
VQKGQKLKVG AIIFTYGDGA AAAPVQPAAP AKTEDKPKAE PKAEAPKQAA PSAAKPAAST 
GTKQTIEFKL PELGENIKQG QLVRIIAKQG ASVSDGQPIL ELETDKAVIE VPATLTGTIK 
EVHVKEGDKI GVGQTIFTVE TTEGNTQPPH PHTNTEGNTQ PPTGGGASSN TEGNTQPPHP 
HSNTEGNPQP PTGGGGSSSA TAARDFELSG QQLARLQFEL ALRSEGKTER EAHPPDVRDL 
GVRVSLTPLT PGRPTVAASP TVRRLAREIG VDIVQVKGTG PGGRISEGDV KLFAKQLIVR 
LQHEAATAKA APKVVLPDFS KWGSIEKEQM RSIRRKTAER LTQAWTTIPH VTQHDRADIT 
ELEKLREKFA KQAEAAGGKL TVTAIALKVI AAAMKKFPKF NASIDIDREE IIYKKYVHIG 
VAVDTEAGLL VPVLRNVDQK NVYQIAAEMN ELSKRARERK LKPEEMEGGT FTITNLGGIG 
GTSFTPIVNL PEVAILGLSR GRTEPVWVND HFEPRTMLPL SLSYDHRIID GADAARYLRW 
VADALEQPVL LLLQG