Gene Gdia_0161 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_0161
Symbol
ID	6973553
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	175354
End bp	176364
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	64%
IMG OID	643389695
Product	pyruvate dehydrogenase (acetyl-transferring) E1 component, alpha subunit
Protein accession	YP_002274576
Protein GI	209542347
COG category	[C] Energy production and conversion
COG ID	[COG1071] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, alpha subunit
TIGRFAM ID	[TIGR03182] pyruvate dehydrogenase E1 component, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.149531
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.00745066
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGGCGAAA CTCGGAAATC CGCGACAGAG GCCGGACGCA ACAGTCCGTC GATGAGCAAG 
GAAGACCTGA CGCGCGCCTT TCATGACATG GTGCTGATCC GCCGGTTCGA GGAACGGGCC 
GGCCAGCTTT ATGGCATGGG GCTGATCGGC GGCTTCTGCC ATCTGTATAT CGGCCAGGAA 
GCCGTGGTCG TCGGCGTGCA GATGGAGCTG AAGCAGGGGG ACAAGATCAT CACCTCCTAC 
CGCGACCATG GGCAGATGCT GGCCGCCGGC ATGGACCCGC GCGGCGTGAT GGCCGAACTG 
ACCGGGCGCG AGGGCGGCTA TTCCCGCGGC AAGGGCGGGT CGATGCACAT GTTCTCGTCC 
GAGAAGCATT TCTATGGCGG GCACGGCATC GTCGGCGCCC AGGTGTCGCT GGGTATCGGT 
CTGGCCTTCG CCAACAAGTA TCGCGGCACG GACGAGGTCT CGATCGCCTA TTTCGGCGAG 
GGCGCGTCCA GCCAGGGTCA GGTCTATGAA AGCTTCAACC TGGCGGCCCT TCACAAGCTG 
CCCTGCGTAT TCGTGCTGGA AAACAACCAT TACGGCATGG GTACCAGCGT CGAGCGGTCG 
TCGGCGTCCA AGGAATTGTG GCGCAATGGC GAGCCCTGGG GCATCCCGGG CCGTCAGGTC 
GACGGCATGG ATGTCGAGGC CGTGCGCGAC GCGGCGCGCG AGGCGATCGA ACATTGCCGG 
CAGGGCAAGG GACCGTACCT GCTGGAGATG ACGACCTATC GCTATCGCGG CCATTCGATG 
TCCGACCCGG CGAAGTACCG CCCCCGCTCC GAAGTGGACG AGATGCGGAA GAATCATGAC 
CCGATCGATC GGGTACGCAA GGAACTGCTG GCCATGGGCG TCGGGGAAGC CGAACTGAAG 
ACGATCGAGG ACAAGGTGAA GGAAGTGGTC GTGGACGCCG CCGATTTCGC GCAGACCAGC 
CCGGAGCCCG ATCCAGCGGA ATTGTGGACC GACGTGCTGG TGGAGGGCTG A

Protein sequence

MGETRKSATE AGRNSPSMSK EDLTRAFHDM VLIRRFEERA GQLYGMGLIG GFCHLYIGQE 
AVVVGVQMEL KQGDKIITSY RDHGQMLAAG MDPRGVMAEL TGREGGYSRG KGGSMHMFSS 
EKHFYGGHGI VGAQVSLGIG LAFANKYRGT DEVSIAYFGE GASSQGQVYE SFNLAALHKL 
PCVFVLENNH YGMGTSVERS SASKELWRNG EPWGIPGRQV DGMDVEAVRD AAREAIEHCR 
QGKGPYLLEM TTYRYRGHSM SDPAKYRPRS EVDEMRKNHD PIDRVRKELL AMGVGEAELK 
TIEDKVKEVV VDAADFAQTS PEPDPAELWT DVLVEG