Gene GSU2291 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU2291
Symbol
ID	2686916
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	2509036
End bp	2510103
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	60%
IMG OID	637126984
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	NP_953340
Protein GI	39997389
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0722] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR00034] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTCGCA CGAGCAACCT GAAGATCAAA AGTATTACCC CCATCATTGC ACCGGGGGAA 
TTACGCCAGG TGTTTCCCCA GTCGGAGGAG GCGGCCGAGT TCGTCAACTC CAGCCGCGCC 
CATATCAAGA ATATCCTCAA GGGCAAGGAT CCGCGCCTGA TGGTGGTGGT GGGCCCCTGT 
TCCATTCACG ATCCGAAATC GGCTCTGGAG TATGCGGGGC GGCTGGCACG CCTGGCGGCC 
GAACTGTCGG ATCAGCTATT CATCGTGATG CGGGTCTACT TCGAAAAGCC CCGCACTACC 
GTAGGCTGGA AGGGACTCAT CAATGACCCC GACATGAACG GCACCCATCA GATATCCAAG 
GGGCTCGGCA TCGCCCGGCG GCTGCTGTCC GAAATAACGG AAATGCTCCT GCCGGTGGCA 
ACCGAAATGC TTGACCCCAT CACGCCCGAC TACCTCGCGG ATTGCATCTC CTGGGGAGCC 
ATCGGCGCTC GTACCACCGA GAGCCAGACC CACCGCGAGA TGGCCAGCGG CCTCTCGTTC 
CCCGTGGGAT TCAAGAACGG CACCGACGGC AATCTCCAGA TAGCCATCGA CGCCATGAAT 
GCGGCACTCC ATTCCCACAG CTTTCTCGGC GTCAACCGGG AGGGGCGCAC CTCCATCATT 
CAGACCACCG GCAACCCCGA TGTCCACATC GTCCTGCGGG GAGGCAAAAA ACCGAACTAT 
TTCCCCGAAG ACATCAGAAA GACCGAAGAG ATGCTGGAAA AGGGGGGGCT CTTCCCCACC 
ATCATGGTCG ACTGCAGCCA CGGCAACTCG GAAAAACGCC ACGAGAAGCA GCCCGACGTA 
CTCTCTTCCG TCGTGGACCA GATTGCGGCC GGCAACCGCT CCATCTCCGG CGTCATGATC 
GAGAGTTTTC TGGAAGAAGG GAACCAGTCG ATCCCCAGAG ATCTCTCAAC CCTCAAGTAC 
GGCGTATCCA TCACCGACAA GTGCATTGAC TGGAAGACCA CCGAAACCAT CCTGCGCTCG 
GCCCACGACC GCCTCAAGGC CGCGGGAGGC AGGCCCCTGC ACGGGTAA

Protein sequence

MIRTSNLKIK SITPIIAPGE LRQVFPQSEE AAEFVNSSRA HIKNILKGKD PRLMVVVGPC 
SIHDPKSALE YAGRLARLAA ELSDQLFIVM RVYFEKPRTT VGWKGLINDP DMNGTHQISK 
GLGIARRLLS EITEMLLPVA TEMLDPITPD YLADCISWGA IGARTTESQT HREMASGLSF 
PVGFKNGTDG NLQIAIDAMN AALHSHSFLG VNREGRTSII QTTGNPDVHI VLRGGKKPNY 
FPEDIRKTEE MLEKGGLFPT IMVDCSHGNS EKRHEKQPDV LSSVVDQIAA GNRSISGVMI 
ESFLEEGNQS IPRDLSTLKY GVSITDKCID WKTTETILRS AHDRLKAAGG RPLHG