Gene Gdia_2076 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_2076
Symbol
ID	6975503
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	2303408
End bp	2304826
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	67%
IMG OID	643391606
Product	2-nitropropane dioxygenase
Protein accession	YP_002276451
Protein GI	209544222
COG category	[R] General function prediction only
COG ID	[COG2070] Dioxygenases related to 2-nitropropane dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.321315
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	0.310329
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGCGA TCAATGCGAT CCGCATGGGC GGGGTGGATG TCCTGCCGCT GATCGAAGGT 
GGAAAGGGCG TGTCGGTTTC GACCGGCATA TCGTCCGGAC ATTGGGCGGC GGCAGGTGGC 
GCCGGCACCG TGTCGATCGT CAACGCCGAT TCGTACGACG AACAGGGTCG TCCGGTTCCG 
CAGGTCTATC ACGGCCGGAC CCGGCGGGAA CGGCACGAGG AACTGATCCG CTACGCCATC 
CGGGGCGGCG TCGCCCAGGC CCGCATCGCC CACGACCTTT CGGGTGGCCG GGGCCGCGTC 
CACGCCAACA TCCTGTGGGA AATGGGCGGG GCCGAGGACG TGATCACCGG CGTGCTGGAA 
GAAGCACCCG GCCTGATCCA CGGCCTGACC TGCGGGGCGG GCATGCCCTA TCGCCTGTCG 
GGCATCGCGA TGCGGTTCGG CATCCATTAT TATCCCATCG TGTCGTCCGC CCGGGCCTTC 
AATGCCCTGT GGAAGCGCTC GTTCCACAAG AGCGCCGACC TGCTGGGCGG CGTGGTGTAC 
GAGGACCCGT GGCGGGCCGG CGGCCATAAC GGCCTGTCGA ACACCGAGGA CCCGGGCAGC 
CCCGAGGACC CGTTTCCGCG CGTCCTGGCG CTGCGCAAGC TGATGCGCAC CTTCGGCCTG 
GACGACACCC CGATCATCAT GGCCGGCGGC GTATGGTGGC TGGAGGAATG GCAGGACTGG 
ATCGACAGTC CCGAACTGGG GCCGATCGCC TTCCAGTTCG GCACCCGCCC GCTGCTGACG 
CAGGAAAGCC CGATCCCCGA CGCGTGGAAG CGCAAGCTGC TGACGCTGAA GAAGGGCGAC 
GTGTTCCTGA ACCGGTTCTC GCCCACCGGC TTCTATTCCT CGGCGGTGAA CAACCCGTTC 
CTGCGGGAAC TGCAGGGGCG GTCGGAACGC CAGGTCGCCT ATTCCACCGA ACCGGTGGGC 
GAGCATACCG CGTCCTACGG CGTGGGCGCC CGCGCCCGGC AGGTCTTCAT GACCGAGGCC 
GACCGCGAGC ATGTCCGCCT GTGGGAACTG GAAGGCTATA CCGAGGCGAT GCGCACGCCG 
GATTCCACCC TGATCTTCGT CACGAAGGAC AAGGCGCAGG AAATCCTGAC CGACCAGGTG 
GACTGCATGG GCTGCCTGTC GGAATGCCGC TTCTCGAACT GGAGCCAGCG GGGCCCGAAC 
TATACCAACG GCCACAAGGC CGATCCGCGT TCCTTCTGCA TCCAGAAGAC GCTGCAGGCC 
GTCGCCCATG CCCACGGGGA CACGGGCGAT GCGGCGATGG ACAACAACCT GATGTTCGGT 
GGCACGAACG CGTGGCGGTT CGGAACCGAT CCGTTCTATG CCAACGGGTT CGTGCCGACG 
GTGGGGCAAC TGGTGGACCG GATTCTCACC GGCCGCTGA

Protein sequence

MKAINAIRMG GVDVLPLIEG GKGVSVSTGI SSGHWAAAGG AGTVSIVNAD SYDEQGRPVP 
QVYHGRTRRE RHEELIRYAI RGGVAQARIA HDLSGGRGRV HANILWEMGG AEDVITGVLE 
EAPGLIHGLT CGAGMPYRLS GIAMRFGIHY YPIVSSARAF NALWKRSFHK SADLLGGVVY 
EDPWRAGGHN GLSNTEDPGS PEDPFPRVLA LRKLMRTFGL DDTPIIMAGG VWWLEEWQDW 
IDSPELGPIA FQFGTRPLLT QESPIPDAWK RKLLTLKKGD VFLNRFSPTG FYSSAVNNPF 
LRELQGRSER QVAYSTEPVG EHTASYGVGA RARQVFMTEA DREHVRLWEL EGYTEAMRTP 
DSTLIFVTKD KAQEILTDQV DCMGCLSECR FSNWSQRGPN YTNGHKADPR SFCIQKTLQA 
VAHAHGDTGD AAMDNNLMFG GTNAWRFGTD PFYANGFVPT VGQLVDRILT GR