Gene Gdia_0133 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_0133
Symbol
ID	6973525
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	146879
End bp	147937
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	71%
IMG OID	643389667
Product	2-nitropropane dioxygenase NPD
Protein accession	YP_002274548
Protein GI	209542319
COG category	[R] General function prediction only
COG ID	[COG2070] Dioxygenases related to 2-nitropropane dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.899957
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	0.134277
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCCTGT CGGATGACGC AATGTTTCGG ACCGCCGCGC GCGCGCGGCT GGACCGCCTG 
TGGTCCGCCG GCACGGCCTT CCTGGGCAGC GAGGTCGCGA TCCTGGGCGG CGCCATGTCC 
TGGGTCAGCG AGCGCCATCT GGTATCGGCC ATTTCCAACG CCGGCGGCTT CGGCGTGCTG 
GCCTGCGGCG CCATGGAACC CGACCGGCTG GCCGAGGAAA TCGCCGCCAC CCAGGCGCTG 
ACCAGCCGCC CCTTCGGCGT CAACCTGATC ACCATGCACC CACGCCTGGA CGACCTGATC 
CAGGTCTGCC TTTCGGCCGG GGTCACGCAT GTCGTGCTGG CCGGCGGCAT TCCGCCGGGG 
CCGGCCATCC GCGCGATCAA GGATGGCGGG GCGCGGGTCG TGGCGTTCGC GCCGGCCCTG 
GTGCTGGCCA AGCGGCTGGT GCGCATGGGC GTCGATGCCC TGGTGATCGA GGGCGCGGAG 
GCCGGCGGGC ATGTCGGCCC GGTCTCGCTG ACCGTCCTGG CGCAGGAAGT GCTGCCCCAT 
ATCCGCTCGG TTCCCGTCTT CGTCGCGGGC GGGCTGGGAC GGGGCGAGGC CATCCTGTCC 
TATCTGGAGC AGGGGGCGGC CGGCGCGCAG CTCGGCACCC GCTTCGCCGC GTCGGCCGAA 
AGCATTGCCC ACGAACGGTT CAAGGCCGCG TTCGTCCGCG CCAACGCCCG CGACGCCGTG 
ACGTCGGTCC AGCTTGACGA ACGCTTCCCC GTCATTCCGG TGCGTGGCCT GTCGAACGAG 
GGCGGACGCG CCTTCCTGCG CCATCAGGCG GAAACGATCC GCCGCTACCT GGACGGCGAA 
CTGACGCGTG AGGCCGCGCA ACTGGATATC GAGCATTTCT GGGCCGGGTC GCTGCGCCGG 
GCGGTGATCG AGGGCGACGT GGAACAGGGT TCGGTCATGG CCGGCCAGTC GGTCGGCATG 
ATCTCCTCCG TCCAGCCGGT CGCGGCCATC ATCGCCGAAC TGGTCGAACA GGCGGTCGAT 
GCGCTGGTTC GGCGCGACAT GCCGGCGGGG GATGCGTGA

Protein sequence

MPLSDDAMFR TAARARLDRL WSAGTAFLGS EVAILGGAMS WVSERHLVSA ISNAGGFGVL 
ACGAMEPDRL AEEIAATQAL TSRPFGVNLI TMHPRLDDLI QVCLSAGVTH VVLAGGIPPG 
PAIRAIKDGG ARVVAFAPAL VLAKRLVRMG VDALVIEGAE AGGHVGPVSL TVLAQEVLPH 
IRSVPVFVAG GLGRGEAILS YLEQGAAGAQ LGTRFAASAE SIAHERFKAA FVRANARDAV 
TSVQLDERFP VIPVRGLSNE GGRAFLRHQA ETIRRYLDGE LTREAAQLDI EHFWAGSLRR 
AVIEGDVEQG SVMAGQSVGM ISSVQPVAAI IAELVEQAVD ALVRRDMPAG DA