Gene Gmet_2375 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gmet_2375
Symbol
ID	3740052
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter metallireducens GS-15
Kingdom	Bacteria
Replicon accession	NC_007517
Strand	+
Start bp	2684673
End bp	2685740
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	61%
IMG OID	637779667
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_385325
Protein GI	78223578
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0722] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR00034] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00000000189988
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAAGA CAAGCAACCT GAAGGTCACG AGCATTACCC CCATCATCGC CCCTGCCGAC 
CTGCGGCAAG TTTTCCCCCA ATCGCTGGAA ACAGCTGAAT TCGTTAATGC GAGCCGGGCC 
CACATCAAGA ACATCCTCAA GGGGAAAGAC ACCCGCCTCA TGGTGGTGGT GGGCCCCTGT 
TCCATTCACG ACCCCAAGGC CGCCCTCGAC TATGCGGGGC GCCTTGCGCG ACTCGCCAGC 
GAACTCTCCG ACCAGCTTTT CATCGTGATG CGGGTCTACT TCGAGAAGCC CCGCACCACC 
ATCGGCTGGA AGGGGCTCAT CAACGACCCC GACATGAACC ACACCCACCA GATCTCCAAG 
GGACTCGGCA TCGCGCGGCG GCTCCTGAAC GACATCACCA GCATGCTCCT CCCCGTGGCG 
TGCGAGATGC TCGATACCAT CACCCCTGAA TACCTGGCCG ACTATATCTC GTGGGGCGCC 
ATCGGCGCCC GGACCACCGA GAGCCAATCG CACCGGGAGA TGGCGAGCGG CCTTTCCTTC 
CCCGTGGGCT TCAAAAATGG CACTGACGGC AACCTGCAGA TCGCCATCGA CGCCATGAAC 
GCGGCGCTCC ACCCCCACAG CTTCCTCGGC ATCAATCGGG ATGGCAAGAC CTCCATCATC 
CAGACCACCG GCAACCCGGA CGTGCACATC GTCCTGCGTG GCGGCAAGAA GCCCAACTAC 
TCTCCCGAGG ACATCGCCAA GACCGAAGAG ATGGTTGAAA AGGGGGGTAT CTTCCCGACC 
ATCATGGTTG ATTGCAGCCA CGGCAACTCG GAGAAGCGCC ACGAGAAGCA GCCGGAGGTG 
CTTGACAGCA TCGTCGACCA GATCGAGGCG GGCAATCGCT CCATCTCGGG GGTCATGATC 
GAGAGCTTCC TCGAAGCGGG GAACCAGCCC ATTCCCAAGG ATCTGTCCCA ACTCCGCTAC 
GGGGTCTCCA CCACCGACAA GTGCATCGAC TGGAAGACCA CCGAGGAAAT CCTGCGCAAG 
GCCCATGAAC GGCTCAAGCG CTGCGGCGGA AGACCGATGC ACGGTTGA

Protein sequence

MTKTSNLKVT SITPIIAPAD LRQVFPQSLE TAEFVNASRA HIKNILKGKD TRLMVVVGPC 
SIHDPKAALD YAGRLARLAS ELSDQLFIVM RVYFEKPRTT IGWKGLINDP DMNHTHQISK 
GLGIARRLLN DITSMLLPVA CEMLDTITPE YLADYISWGA IGARTTESQS HREMASGLSF 
PVGFKNGTDG NLQIAIDAMN AALHPHSFLG INRDGKTSII QTTGNPDVHI VLRGGKKPNY 
SPEDIAKTEE MVEKGGIFPT IMVDCSHGNS EKRHEKQPEV LDSIVDQIEA GNRSISGVMI 
ESFLEAGNQP IPKDLSQLRY GVSTTDKCID WKTTEEILRK AHERLKRCGG RPMHG