Gene Gura_0027 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gura_0027
Symbol
ID	5163991
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter uraniireducens Rf4
Kingdom	Bacteria
Replicon accession	NC_009483
Strand	-
Start bp	35537
End bp	36556
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	60%
IMG OID	640547526
Product	3-deoxy-7-phosphoheptulonate synthase
Protein accession	YP_001228818
Protein GI	148262112
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2876] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR01361] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.00000800043
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCATTG TCATGAAAGC AGGGGCGGTA AAAAAGGACA AGGACGAGGT ATTAAAGCGG 
ATCAAGGAAC TGGGGTACAA GCCCCATGTG ATTCACGGCG CCACACGGGA CGTAATCGGC 
GCGGTCGGCG ACGAACGGGG GAAAGCGGTA CTACAGTCCA TCGAATCCAT GCACGGGGTG 
GAGAACGTGG TGCCAATCCT CCAGCCCTAC AAGCTGGCCT CAAAGGAAGT GAAGAAGGAG 
TCGAGCATCA TTCCCATCAC CGACACGCTG AGCATCGGCG GCAAGCAGCT CATCGTCATG 
GCCGGGCCCT GTTCGGTTGA AAGCGAGGAA CAGATCATCG CCTCCGCAAT GGCGGTGAAG 
GAAGCGGGAG CCCATGTACT GCGCGGCGGG GCGTTCAAAC CGCGCACTTC CCCTTATTCG 
TTCCAGGGGC TCGAAGAGGA AGGGCTGAAG CTCCTGGCCA AGGCCCGAGA CCTTACCGGT 
CTCCCCATCG TCACCGAGGT GGTCAACCCG GAAACCGCCG AACTGGTAGC CGAATATGCG 
GACATCCTCC AAATCGGAGC GCGCAACGCC CAGAACTTCG CCCTGCTGAA AAAGGTCGGC 
CAGTTGAAAA AAGCTGTTCT CCTGAAACGC GGCATGTCCA TGACCATCCA GGAATTCCTC 
ATGAGTGCCG AATACATCAT GAGCGAGGGG AATCAGTCGG TGATTCTCTG CGAACGCGGC 
ATCCGCACCT TCGAGACCGC CACCCGCAAC ACCCTCGACC TGTCTGCGAT CCCGGTGCTG 
AAGGAAAAAA CCCACCTGCC GATTATCGCC GACCCCTCCC ACGGCACCGG CAACTACCAC 
TATGTTGCCC CCATGGCTTA CGCCGCCGTG GCTGCCGGGG CCGACGGCCT GATCATCGAG 
GTGCACCCCG ACCCGGAACA CGCCTCCTCC GACGGACCGC AGTCGTTGAA GCCCGCCAAG 
TTCGCAAGGA TGATGGCCCA ACTGCGGCTC TTCGCCGAGG CAGCGGAGAG GGAGCTGTAA

Protein sequence

MIIVMKAGAV KKDKDEVLKR IKELGYKPHV IHGATRDVIG AVGDERGKAV LQSIESMHGV 
ENVVPILQPY KLASKEVKKE SSIIPITDTL SIGGKQLIVM AGPCSVESEE QIIASAMAVK 
EAGAHVLRGG AFKPRTSPYS FQGLEEEGLK LLAKARDLTG LPIVTEVVNP ETAELVAEYA 
DILQIGARNA QNFALLKKVG QLKKAVLLKR GMSMTIQEFL MSAEYIMSEG NQSVILCERG 
IRTFETATRN TLDLSAIPVL KEKTHLPIIA DPSHGTGNYH YVAPMAYAAV AAGADGLIIE 
VHPDPEHASS DGPQSLKPAK FARMMAQLRL FAEAAEREL