Gene Gdia_3503 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_3503
Symbol
ID	6976955
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	3835601
End bp	3836566
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	68%
IMG OID	643393023
Product	Pyruvate dehydrogenase (acetyl-transferring)
Protein accession	YP_002277842
Protein GI	209545613
COG category	[C] Energy production and conversion
COG ID	[COG1071] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, alpha subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.22146
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.0999456
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGATCG CGCGGGAAAC GTTGCTTCGC TCCTATCGCG CCATGCGGAC GATCCGTGAT 
TTCGAGGAAC GGCTGCATGT CGAATTCGCG ACGGGCGAAA TCCCCGGCTT CGTCCACCTC 
TATTGCGGCG AGGAAGCGTC AGGCGTCGGC GTCTGTGCCA ACCTGACCGA TACCGACACC 
ATCTCCAGCA CCCATCGTGG CCATGGCCAC TGCATCGCCA AGGGGGTCGA GGTCGCGGGC 
ATGATGGCCG AGATCTACGG CCGTCGCACC GGCGTGTGCC GGGGCAAGGG CGGGTCGATG 
CACATCGCCG ACCTGTCGCG CGGCATGCTG GGCGCGAACG GCATCGTGGG CGGCGGCCCG 
CCGCTGATGT GCGGCGCCGC CCTGGCACAC AAGACGCTGA AGGATGGCGG CGTCGCGGTC 
GCGTTCTACG GCGACGGCGC GTCGAACGAG GGCTCGACGC TGGAAAGCCT CAACCTCGCG 
TCGGTCTGGC GCCTGCCGGT GGTCTTCGTG CTGGAGGATA ACGGCTACGG CGAGGCCACG 
GCGTCGTCCT ACGCCTGCGC CGGATCGCAG AAGGCCCGGG CCGAAGGGTT CGGCATGCCC 
TACATGGAAT GTGACGGGTC GGATTTCTTC GCGGTGCACC AGGCGGCGGC CGAAGCCATC 
GCCCATGCCC GCGCCGGAAA GGGCCCCGTC ATGCTGCATG TCCATCTGGC GCGCTGGTAC 
GGGCATTTCG AAGGCGATGC CATGACCTAT CGCGCGTCCG GCGAAGTCGC GGCGGAACGG 
CGCGACCGTG ACTGCCTGGC GCTGTTCCGC ACCCGCGTGA CCGAGGCCGG CCTGCTGGAG 
CATTCCGACC TGGACGACAT CGACGCCTCG GTCCGTGACG AGATCGAAAG CGCGGTCGTC 
GCCGCGAAGC AGGCCCCGCT GCCCGAACCC GAGGACCTGC TGGCCGATGT CTATGTCCGT 
TACTGA

Protein sequence

MQIARETLLR SYRAMRTIRD FEERLHVEFA TGEIPGFVHL YCGEEASGVG VCANLTDTDT 
ISSTHRGHGH CIAKGVEVAG MMAEIYGRRT GVCRGKGGSM HIADLSRGML GANGIVGGGP 
PLMCGAALAH KTLKDGGVAV AFYGDGASNE GSTLESLNLA SVWRLPVVFV LEDNGYGEAT 
ASSYACAGSQ KARAEGFGMP YMECDGSDFF AVHQAAAEAI AHARAGKGPV MLHVHLARWY 
GHFEGDAMTY RASGEVAAER RDRDCLALFR TRVTEAGLLE HSDLDDIDAS VRDEIESAVV 
AAKQAPLPEP EDLLADVYVR Y