Gene GSU2025 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU2025
Symbol	aroB
ID	2686097
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	-
Start bp	2217113
End bp	2218201
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	61%
IMG OID	637126716
Product	3-dehydroquinate synthase
Protein accession	NP_953074
Protein GI	39997123
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0337] 3-dehydroquinate synthetase
TIGRFAM ID	[TIGR01357] 3-dehydroquinate synthase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCATCG AGACACTGAG AGTAGAACTC GGTGAACGGA GCTACGATAT TCGCGTCGGC 
TCGGCGATCA TCGGCACGAT CGGCGCCGTG TGTCGTGACG CTGTGGCCGG CAGGCGCGTG 
GCCGTTGTGA CCAATACCAC CGTTGGTCCC CTCTATGCGG ACGGTGTTGT TGATTCGTTG 
ACCGCCGCCG GTTTTACCGT GCTTCGCATT GATATCCCCG ATGGAGAAGA GCATAAAACT 
TCTGTCACCC TCACTAGTGT CTATGACGAA CTCATCAAAG GCGGATTGAC GCGGGACTCT 
CTTCTTGTTG CCCTTGGCGG AGGGGTGGTT GGAGACCTGG CCGGTTATGC CGCTGCCACG 
TATCTGCGCG GTGTTCCCTT CGTGCAGGTC CCGACCACGC TCCTCGCTCA GGTGGATAGC 
AGCGTGGGCG GCAAGACCGG CATCAACCAT CCACTGGGCA AGAATCTGAT CGGCGCGTTC 
CATCAGCCCA GAGCGGTTCT CATTGACGTG GACACCCTTG CAACTCTCCC CCAGCGTGAG 
TATCTCGGCG GCCTTGCCGA AGTCATCAAA TATGGCGTGG TGCTCGACGG AAAGTTCTTC 
GCGTTTCTCG AACAGAATGT GAGCGCTCTT CTCGGGCGAG ACCGGCAGAC GTTGGTCCGT 
GCCATTACGC GTTGCTGTGC GCTGAAGGCC TGGGTCGTGG AGCAGGATGA ACGCGAGACC 
GGACTTCGGG CGGTCCTCAA CTACGGGCAC ACGTTCGGCC ACGCCGTGGA GGCGCTGACG 
GGCTACACTG CCGTTCTCCA CGGGGAGGCG GTCGCCATTG GCATGGTCCG GGCCGCTGTC 
CTGGCAGAGG CCCGGGGGCA CTCTTCGGCC GGAGATACCC GACGGATTCG CGCACTTGTG 
GAGGCCTTGG GGCTGCCGAC CGAACTCCCG TCGTTTGATG CAGACAGCTA CCGGGATGTA 
CTTCTGCGCG ATAAGAAGGC TCGGGATCGC GGGCTGGACT TCGTACTCAA CCGGGGAATA 
GGCGGCCATG AGATCGTCAG GATCGAAAAC CTGTCTGAAG TATTCGGCAT CTGCGGCGTG 
GGGGAATGA

Protein sequence

MTIETLRVEL GERSYDIRVG SAIIGTIGAV CRDAVAGRRV AVVTNTTVGP LYADGVVDSL 
TAAGFTVLRI DIPDGEEHKT SVTLTSVYDE LIKGGLTRDS LLVALGGGVV GDLAGYAAAT 
YLRGVPFVQV PTTLLAQVDS SVGGKTGINH PLGKNLIGAF HQPRAVLIDV DTLATLPQRE 
YLGGLAEVIK YGVVLDGKFF AFLEQNVSAL LGRDRQTLVR AITRCCALKA WVVEQDERET 
GLRAVLNYGH TFGHAVEALT GYTAVLHGEA VAIGMVRAAV LAEARGHSSA GDTRRIRALV 
EALGLPTELP SFDADSYRDV LLRDKKARDR GLDFVLNRGI GGHEIVRIEN LSEVFGICGV 
GE