Gene Gdia_3502 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_3502
Symbol
ID	6976954
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	3834527
End bp	3835555
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	67%
IMG OID	643393022
Product	Transketolase central region
Protein accession	YP_002277841
Protein GI	209545612
COG category	[C] Energy production and conversion
COG ID	[COG0022] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, beta subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.257276
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.0335061
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAAGA AGAGCTATCG GCAGGCCATC AACGAGGCCC TGCGACTGGA AATGCGGCGC 
GACCCGCGCG TGATCCTGAT GGGCGAGGAC GTCGCCGGCG GACATGGCGG ATCGTCGGGC 
GTCACCGACG CCTGGGGCGG CGTGCTGGGC GTCACCAAGG GCCTGTTGAG CGAATTCGGC 
GAGGATCGCG TCCTGGACAC CCCGATCACG GAAGCATCCT ATATCGGCGC CGCCGCCGGG 
GCCGCCGCGA CCGGCCTACG CCCCGTCGCC GAGCTGATGT TCGTCGATTT CGTGGGCTGC 
TGCCTGGACC AGATCATGAA CCAGGCCGCC AAGTTCCGCT ACATGTTCGG CGGCAAGGCC 
CGCACCCCGC TGGTCATCCG CGCCATGTTC GGCGCCGGCT TCAACGCCGC GGCCCAGCAC 
AGCCAGGCGC TGTACCCGCT GTTCACCCAC ATTCCCGGGC TGAAGGTGGT CGTCCCGTCC 
TCGCCCTACG AGGCCAAGGG CCTGCTGATC GAGGCGATCC GCGACGACGA TCCGGTGATC 
TTCCTTGAAC ACAAGGTCAT GTATGACGAC GAGGAAGAGG TGCCCGACGA AGCCTATACC 
ATCCCGTTCG GCGAGGCCAA CCTGACGCGT GAGGGCGACG ACCTGACGAT CGTGGCGTTC 
GGCCGCATGG TGAAGCTGGC GAACGAGGCC GCCGACCGGC TGCAAAAGCA GGGCATCGGC 
TGCACCGTCA TCGATCCGCG CACCACCTCG CCGCTGGATG CCGAGACGAT CCTGGACAGC 
GTGACCGAGA CCGGCCGGCT GGTGATCGTC GATGAATCCA GCCCGCGCTG CAACATGGCC 
GCCGACATCT CCGCCCTGGT GGCCGAACAG GCGTTCGACG CGCTGAAGGC CCCGATCCGG 
CGGGTGATGC CACCCCACAC GCCGGTGCCG TTCGCATCGG TGCTGGAAAG CCTGTACCTG 
CCCGACGTGG CGAAGATCGA AGCGGCTGCC CGTGCCGTGA TGACCCATCG CATCCGAGAG 
GTCGCCTGA

Protein sequence

MSKKSYRQAI NEALRLEMRR DPRVILMGED VAGGHGGSSG VTDAWGGVLG VTKGLLSEFG 
EDRVLDTPIT EASYIGAAAG AAATGLRPVA ELMFVDFVGC CLDQIMNQAA KFRYMFGGKA 
RTPLVIRAMF GAGFNAAAQH SQALYPLFTH IPGLKVVVPS SPYEAKGLLI EAIRDDDPVI 
FLEHKVMYDD EEEVPDEAYT IPFGEANLTR EGDDLTIVAF GRMVKLANEA ADRLQKQGIG 
CTVIDPRTTS PLDAETILDS VTETGRLVIV DESSPRCNMA ADISALVAEQ AFDALKAPIR 
RVMPPHTPVP FASVLESLYL PDVAKIEAAA RAVMTHRIRE VA