Gene Gdia_0403 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_0403
Symbol
ID	6973797
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	440106
End bp	441881
Gene Length	1776 bp
Protein Length	591 aa
Translation table	11
GC content	70%
IMG OID	643389935
Product	3-dehydroquinate synthase
Protein accession	YP_002274814
Protein GI	209542585
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0337] 3-dehydroquinate synthetase [COG0703] Shikimate kinase
TIGRFAM ID	[TIGR01357] 3-dehydroquinate synthase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	0.831997
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCACGTC CGATCGAACC GCCAGCCCCC GAGAGTACCG ACCTGTCCCC CGCCGGGGGG 
CGCGACGCCC CGTTCCTGGC GTTCGACCTC GATGCCCTGG TTGCCGCCGA CAGGCCCGAC 
AGGCCGGGCC CGCGCGCCCC GGGACCGCAC GAGCGCAGCG TCGTGCTGGT CGGGCTGATG 
GGGGCGGGCA AGACGACGAT CGGCCGGCGG ATCGCGGCAC GGCTGGGCAT GCCCTTCGTC 
GATGCCGACG TGGAAATCGA GCGCGCGGCC GGATGTTCCA TCGCCGACCT GTTCCGCCGG 
TATGGCGAGG CCGAATTCCG CAAGGGCGAG CACCGCGTCA TCCGCCGCAT CCTGAGCGGC 
CACCCGCTGG TGCTGGCGAC GGGCGGCGGC GCGTTCATGG ACCCGGTGAC CCGCGCGGTC 
ATCCGCGACC GCGCGACCTC GGTCTGGCTG CGGTGCCCGC TGCCGGTGCT GGTGCGCCGC 
GTCCAGGGGC GGACCCACCG GCCCCTGCTG AACGAGGGCA ACCCGCGCGA CATCCTGGCG 
GCCCTGATGG AAATCCGGCA TCCGGTCTAT GCCGAAGCGA ACATCACCGT GGATTGTGGA 
GAAGAAAGCG TGGACCAGAG TGCCGCCACC GTCATCAGCG CCCTGACCCT GGCGAAGCCG 
CCGCGACTCG TCCCCGTGAT CCTGGAACGC TGGCGCTACG ACGTGACCAT CGGCGAGGAC 
CTGCTGCGCC ATGCCGGAAT CCTGCTGGCC CCGGTCCTGC CGCAAAAGCG TGTGGTGGTC 
GTGACCGATT CGACCGTCGC GACGCTGCAC CTGCCGCGCC TGCTGGCCGG GCTGGCCGAG 
GGCGCGATCC GGGCGGAAAC GATCGTCGTC CCGCCCGGGG AAGGGTCGAA GACAATGGCC 
GAATACGAGC GCGTGACCAA CGCGCTGCTG GACATGGGGG TCGAGCGCGG CACCACGGTG 
ATCGCCCTGG GCGGCGGCGT GGTGGGCGAC CTGGCGGGAT TTGCCGCCGC CACCACCCTG 
CGCGGCCTGC CCTTCGTGCA GATCCCGACG ACGCTGCTGT CGCAGGTCGA TTCGTCGGTG 
GGCGGCAAGA CGGGGATCAA CACCCCGTTC GGCAAGAACC TGCTGGGCGC CTTCCATCAG 
CCGCTGGCGG TGCTGGTGGA TACCACGACG CTGGCCAGCC TGCCGGCGCG CGAGGTCCGC 
GCCGGCTATG CCGAGATCGT CAAATCCGGC CTGATCGGCG ATGCCGCCCT GTTCGAATGG 
TGCGAAGCCA ACGGCCAGGC CGTACTGGAC GGTGACGCCG ATATCCGGGC CGAGGCCGTC 
CGCCAGGCCT GCGCGTTCAA GGCCCATGTC GTCGGCGACG ACGAGCGGGA AGAAAAGAAA 
TCGGACGGCC GCGCACTACT CAACCTGGGC CATACGTTCG GCCACGCGCT GGAGGCCGAA 
CTGGGCTATG ACGGCCGCCT GCTGCATGGC GAGGCCGTGT CGATCGGCCT GCGCCTGGCG 
TTCCTGGCGT CGGTCCGGAT GGGGTTCTGC GACCGCACCG ACCTGAACCG CGTCACCGCC 
CATCTGGAGC GGCTGGGCAT GCCGGCGCGG ATCAGCGACG TTGGCGAAAC GTTCTCGGCC 
GACCGGTTGA TCGCGCATAT GCAGCGGGAC AAGAAAATGC GCGACGGACG CCTGTCCTTC 
GTCCTGGTGC GCGGGATCGG GCAGGCCTTC ACCTGCCGCG ACGTCCCGGA CGCGGTGGTC 
CGCGATATTC TTTTGGCGGA AGGATGCGCG GCCTGA

Protein sequence

MSRPIEPPAP ESTDLSPAGG RDAPFLAFDL DALVAADRPD RPGPRAPGPH ERSVVLVGLM 
GAGKTTIGRR IAARLGMPFV DADVEIERAA GCSIADLFRR YGEAEFRKGE HRVIRRILSG 
HPLVLATGGG AFMDPVTRAV IRDRATSVWL RCPLPVLVRR VQGRTHRPLL NEGNPRDILA 
ALMEIRHPVY AEANITVDCG EESVDQSAAT VISALTLAKP PRLVPVILER WRYDVTIGED 
LLRHAGILLA PVLPQKRVVV VTDSTVATLH LPRLLAGLAE GAIRAETIVV PPGEGSKTMA 
EYERVTNALL DMGVERGTTV IALGGGVVGD LAGFAAATTL RGLPFVQIPT TLLSQVDSSV 
GGKTGINTPF GKNLLGAFHQ PLAVLVDTTT LASLPAREVR AGYAEIVKSG LIGDAALFEW 
CEANGQAVLD GDADIRAEAV RQACAFKAHV VGDDEREEKK SDGRALLNLG HTFGHALEAE 
LGYDGRLLHG EAVSIGLRLA FLASVRMGFC DRTDLNRVTA HLERLGMPAR ISDVGETFSA 
DRLIAHMQRD KKMRDGRLSF VLVRGIGQAF TCRDVPDAVV RDILLAEGCA A