Gene GM21_2255 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_2255
Symbol
ID	8137595
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	2628299
End bp	2629387
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	62%
IMG OID	644869870
Product	phospho-2-dehydro-3-deoxyheptonate aldolase
Protein accession	YP_003022062
Protein GI	253700873
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0722] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR00034] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	94
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCAAGA CCAACAATCT CAAGGTAAGA AGCATCACTC CGATCATTGC ACCTACCGAT 
CTCAGACAGG TCTTCCCCAT GTCCGAGAAA TCCGGGACCT GCGTGAGCAG CAGCCGCGCA 
GCCATCACCA GGATCTTGAA GGGAGAGGAC AAGCGGCTCA TGGTGGTCGT CGGCCCCTGC 
TCCATTCACG ACCCCAAGGG AGCCCTTGAG TACGCCGAGA AGCTCGCGGC GCTCGCCAAG 
GAGGTCTCCG AGGAAATGCT GCTGATCATG CGCGTGTACT TCGAGAAGCC GCGCACCACC 
ATCGGGTGGA AGGGGCTCAT CAACGACCCG GACATGAACG GCACCCACCA GATCTCCAAG 
GGGCTCGGCA TCGCCCGCGG CCTTCTCTGC AAGATCACCG AGATGGGGCT GCCGGTCGCG 
ACCGAGATGC TCGACCCGAT CACCCCCGAG TACCTGGCCG ACCTCCTCTC CTGGGGCGCC 
ATCGGGGCCC GCACCACCGA ATCACAGACC CACCGCGAGA TGGCTAGCGG CCTCTCCTTC 
GCGATAGGGT TCAAAAACGG CACCGACGGC AACCTCCAGA TCGCCATCGA CGCCATGAAG 
GCGGCGCTTC ATTCCCACAG CTTCCTCGGC ATCAACCGCG ACGGCCTGAC CTCCATCATC 
CAGACCACCG GCAACCCCGA CGTGCACATG GTCCTGCGCG GCGGGAGCAA GAAGCCGAAC 
TACTCCCCCG AGGACATCGC CAAATCCGAG GAGATGATCG CCAAGGCGGG ACTGACCCCG 
ACCATGATGG TCGACTGCAG CCACGGCAAC TCCGAGAAGA AGTACGAGCG GCAACCCGAG 
GTCATGAAGA GCGTGATCGA CCAGATCGCT GCCGGCAACC GCAGCATCTC CGGCGTGATG 
ATCGAGAGCT ACCTGAAGGA AGGGAACCAG CCGATGCCCA AGGACGGCGA TCCCTCCTCC 
TTAGCCTACG GCGTATCGAT CACCGACAGC TGCATCAACT GGGAGACCAC CGAGGCCACC 
CTGCGCGAAG CCCACCGCAG ATTGAAAGCC TGCGGCGGGA GAAAGATCTC TTATATAGTT 
AAAGGCTAA

Protein sequence

MIKTNNLKVR SITPIIAPTD LRQVFPMSEK SGTCVSSSRA AITRILKGED KRLMVVVGPC 
SIHDPKGALE YAEKLAALAK EVSEEMLLIM RVYFEKPRTT IGWKGLINDP DMNGTHQISK 
GLGIARGLLC KITEMGLPVA TEMLDPITPE YLADLLSWGA IGARTTESQT HREMASGLSF 
AIGFKNGTDG NLQIAIDAMK AALHSHSFLG INRDGLTSII QTTGNPDVHM VLRGGSKKPN 
YSPEDIAKSE EMIAKAGLTP TMMVDCSHGN SEKKYERQPE VMKSVIDQIA AGNRSISGVM 
IESYLKEGNQ PMPKDGDPSS LAYGVSITDS CINWETTEAT LREAHRRLKA CGGRKISYIV 
KG