Gene Gdia_2032 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_2032
Symbol
ID	6975459
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	2253626
End bp	2254690
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	73%
IMG OID	643391562
Product	A/G-specific adenine glycosylase
Protein accession	YP_002276407
Protein GI	209544178
COG category	[L] Replication, recombination and repair
COG ID	[COG1194] A/G-specific DNA glycosylase
TIGRFAM ID	[TIGR01084] A/G-specific adenine glycosylase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.0489232
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCCCCTT CATCCGCCGA CCTGCTGCAT TGGTACGACC GCCACCGGCG AACCCTGCCC 
TGGCGGGCCC TGCCCGGCCA CAGCGCCGAT CCCTACCATG TCTGGCTGAG CGAAATCATG 
CTGCAGCAGA CGACGGTCAC GGCGGTCATC CCCTATTATC GCCGATTCCT GGACCGGTTT 
CCCACTGTCG TGGACCTGGC GCAGGCCGAT TCCGACACCG TCATGGCCGC CTGGGCCGGT 
CTGGGCTATT ACGCCCGGGC GCGCAACCTG CATGACTGCG CGCGGGTGGT GGCGGCGGCC 
GGCCGCTTTC CCGACGACAT GCCGAGGCTG CTGGCCCTGC CGGGGGTGGG GGCCTATACC 
GCCGCCGCCA TCGCCGCCAT CGCCTTCGGC CGGCCGGTGG TCCCGGTGGA CGGCAATGTG 
GAGCGCGTGA CCAGCCGGCT GTTCGCCCTG TCCGACCCGC TGCCGGGCGC CCGCAAATCC 
ATCGCCCGCC AGGCGGCCAC CCTGAACCAT TCCGCCGAGG CGCAGGCGCG GCCGTCCGAT 
TTCGCGCAGG CGCTGTTCGA CCTGGGCGCC GGGGTCTGCA CGCCGCGAAG CCCGGCCTGC 
GCCCTGTGTC CATGGCGGGA GGCCTGCGCC GGGTTCCGCC AGGGCATCGC GGCGAACCTG 
CCCGTCAAGG CGCCCCGCGC GACGAAGCCG GTGCGCTACG GCGCGCATTT CCACGTCACC 
GACGCGGCCG GCCACATCCT GCTGCGCCGC CGGGCGGCGA AGGGATTGCT GGGCGGCATG 
CTGGAACTGC CGGGGACCGA CTGGCGCGCC GCCCCCTGGA CGCCGGCCGA GGCCCTGGCC 
CATGCCCCCC TGGCGGCATC CTGGCAGGCG GCCGGGCGGG TGACGCATGT CTTCACCCAT 
TTCACCCTGC ATGTGGACCT GTATGACGCG GCGGTGGGGC ACTTCCCCAA CAGCGCGGCG 
CGGGCGGGCG GCCTGGCCTT CGCCGGGCAG GCCCTGGACG GGCTGGCCCT GCCGTCGCTG 
ATGCGCAAAT GCCTGGCCGC GATCCGTCCC GCCATGACGG CATGA

Protein sequence

MPPSSADLLH WYDRHRRTLP WRALPGHSAD PYHVWLSEIM LQQTTVTAVI PYYRRFLDRF 
PTVVDLAQAD SDTVMAAWAG LGYYARARNL HDCARVVAAA GRFPDDMPRL LALPGVGAYT 
AAAIAAIAFG RPVVPVDGNV ERVTSRLFAL SDPLPGARKS IARQAATLNH SAEAQARPSD 
FAQALFDLGA GVCTPRSPAC ALCPWREACA GFRQGIAANL PVKAPRATKP VRYGAHFHVT 
DAAGHILLRR RAAKGLLGGM LELPGTDWRA APWTPAEALA HAPLAASWQA AGRVTHVFTH 
FTLHVDLYDA AVGHFPNSAA RAGGLAFAGQ ALDGLALPSL MRKCLAAIRP AMTA