Gene Gdia_0163 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_0163
Symbol
ID	6973555
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	177727
End bp	179001
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	69%
IMG OID	643389697
Product	pyruvate dehydrogenase complex dihydrolipoamide acetyltransferase
Protein accession	YP_002274578
Protein GI	209542349
COG category	[C] Energy production and conversion
COG ID	[COG0508] Pyruvate/2-oxoglutarate dehydrogenase complex, dihydrolipoamide acyltransferase (E2) component, and related enzymes
TIGRFAM ID	[TIGR01349] pyruvate dehydrogenase complex dihydrolipoamide acetyltransferase, long form

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.625512
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.00113333
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGTCCGTGA ATATCCTGAT GCCGGCGCTG TCGCCGACGA TGACCGAGGG CAAGCTGTCC 
CGCTGGCTGA AGAAGGAAGG CGACGCGATC CATTCCGGCG ACGTGATCGC CGAGATCGAG 
ACCGACAAGG CGACGATGGA GGTCGAGGCC GTGGATGACG GCCTGCTGGG CCGCATCCTG 
GTTTCCGAAG GCACCGAAGG GGTGAAGGTC AACGCGCCGA TCGCCATCGT GGTGGCGGAA 
GGCGAGAGCG TTCCCGATGA CGCAGCCCCC GTGGCGGCTG CTCCGGCGGC GGCTCCCGTG 
GCGGCGGCCC CGGTTTCCGA GGCCAAGGCA CCGGCGATCG CGGCCGCCCC GGCCGTGCCC 
CAGGGCGCGG CGCCGGCTCC GGCCCAGGGC ACGCGCGTCT TCGCGTCGCC GTTGGCGCGG 
CGCATCGCGG CGCAGAAGGG GATCGACCTG TCCGGCGTGA AGGGCAGCGG CCCGAATGGC 
CGGATCGTGC GTCGCGACGT CGAATCCGCG ACGGCGGCGC CCGTGGCGGC CCCGGTACCA 
TCCCCGGCAC CGTCCGCCCC GGCCGCAGCG ATCGAGGCGC CGCATACCGC CGTGCCGAAC 
TCGACCATCC GCAAGGTCAT CGCCCGGCGG CTGACCGAGG CGAAGTCGAC CATCCCGCAT 
TTCTACGTGG CGATGGATGT GGAACTGGAC GCGCTGCTGG ACCTGCGGGC GAAGCTGAAC 
GCGGCCTCGC CGGCCGAGGG GCCGGGAGCG TTCAAGCTGT CGGTCAACGA CATGCTGATC 
AAGGCGGTGG CGGTAACCCT GCGCCGGGTG CCGAAGGTCA ATGCATCCTA TACCGAGGAC 
GCGACGATCC TGTACGACGA TGTCGATGTC TCGGTCGCCG TGTCGATCGC CGATGGGCTG 
ATCACGCCGA TCGTGCGCCA GGCCGACCGC AAGTCGCTGC GCGAGATCAG CGAGGACGCG 
AAGGATCTGA TCACCCGCGC CCGTGCCGGC AAGCTGAAGC CGCAGGAATT TCAGGGCGGA 
TCGTTCTCGA TCTCGAACAT GGGCATGTAT GGGGTGAAGG AATTCTCGGC CATCATCAAT 
CCGCCCCAGG CCGCCATCCT GGCCATCGCG GCGGCTGAGA AGCGCGCCGT GGTCAAGGAC 
GACGCAATCC GGATCGCCAC CGTGATGACG GTGACGCTGT CGGTCGATCA TCGCGTCGTC 
GACGGCGCCC TGGCCGCCGA ATGGGTTTCG ACCTTCCGCT CGGTGGTCGA ATCGCCGCTG 
AGCCTGGTGG TCTGA

Protein sequence

MSVNILMPAL SPTMTEGKLS RWLKKEGDAI HSGDVIAEIE TDKATMEVEA VDDGLLGRIL 
VSEGTEGVKV NAPIAIVVAE GESVPDDAAP VAAAPAAAPV AAAPVSEAKA PAIAAAPAVP 
QGAAPAPAQG TRVFASPLAR RIAAQKGIDL SGVKGSGPNG RIVRRDVESA TAAPVAAPVP 
SPAPSAPAAA IEAPHTAVPN STIRKVIARR LTEAKSTIPH FYVAMDVELD ALLDLRAKLN 
AASPAEGPGA FKLSVNDMLI KAVAVTLRRV PKVNASYTED ATILYDDVDV SVAVSIADGL 
ITPIVRQADR KSLREISEDA KDLITRARAG KLKPQEFQGG SFSISNMGMY GVKEFSAIIN 
PPQAAILAIA AAEKRAVVKD DAIRIATVMT VTLSVDHRVV DGALAAEWVS TFRSVVESPL 
SLVV