Gene GM21_3351 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3351
Symbol
ID	8138718
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	3877753
End bp	3878772
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	63%
IMG OID	644870969
Product	aspartate-semialdehyde dehydrogenase
Protein accession	YP_003023134
Protein GI	253701945
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0136] Aspartate-semialdehyde dehydrogenase
TIGRFAM ID	[TIGR01296] aspartate-semialdehyde dehydrogenase (peptidoglycan organisms)

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	65
Fosmid unclonability p-value	0.0830053
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAAAC TTTGGAATGT GGCAGTGGTA GGCGCGACCG GCGCGGTCGG AACCCAGATG 
ATCGAGTGCC TGGAGGAGCG GAAGTTCCCG GTGGGAAAGA TAAAGTTCCT GGCCAGCGCC 
CGCAGCGCAG GGAAGGTCCT TGAGTTCAAC GGCAAGCCCG TGCCGGTGGA AGAGCTGAAA 
CACGACTCCT TCGAGGGGAT CGACATTGCC CTCTTCTCCG CAGGGGGCGC GCGCTCCGAG 
GAGTTCTGCC CCTCCGCCGC CAAGGCTGGC GCTGTCTGCA TCGACAACTC CAGCGCCTGG 
CGCATGGACC CGGAGGTGCC GTTGGTGGTC CCCGAGGTGA ACCCCCACGC GCTTGCCGGC 
TACCGCAAGA AGGGAATCGT CGCCAACCCC AACTGCTCCA CCATCCAGAT GGTGGTCGCC 
TTGAAGCCCC TGCACGACTT CGGGTCCATC AAGCGGATCG TCGTCTCCAC CTACCAGGCG 
GTTTCCGGCA CCGGCAACAA GGCGATCGAC GAGCTGCGCA AGCAGACCGG AGAGCTTTTG 
AACGGGCGGC CGCCCAAGAA CGAGGTCTAT CCGCACCGGA TCGCCTTCAA CTGCCTGCCG 
CAAATCGATT CCTTCTGCGA CAACGGTTAC ACCAAGGAAG AGATGAAGAT GGTGAACGAG 
ACCCGGAAGA TCATGGAGGC GGACATCAAG ACCACCGCCA CCTGCGTCAG GGTTCCCGTC 
TTCTACGGGC ATTCCGAGTC GGTGAACGTA GAGACCGCGA AGAAGATCAC CGTGGCCAAG 
GCGCGCGAGC TATTGGAAGA CGCGCCCGGC GTGGAACTGG TCGACAACCC CGCCAACGGC 
GAGTATCCGA TGGCGATGGA CGCCGCGGGC GAGGACCTGA CCCTCGTAGG TCGCATCCGC 
GAGGACGCCA CCGTCGCCAA CGGACTCAAC CTCTGGATCG TCGCCGACAA CCTCAGGAAG 
GGCGCCGCCA CTAACGCAGT GCAGATCGCG GAGCTGCTGG TGGATGAGTA CCTGAAGTAA

Protein sequence

MKKLWNVAVV GATGAVGTQM IECLEERKFP VGKIKFLASA RSAGKVLEFN GKPVPVEELK 
HDSFEGIDIA LFSAGGARSE EFCPSAAKAG AVCIDNSSAW RMDPEVPLVV PEVNPHALAG 
YRKKGIVANP NCSTIQMVVA LKPLHDFGSI KRIVVSTYQA VSGTGNKAID ELRKQTGELL 
NGRPPKNEVY PHRIAFNCLP QIDSFCDNGY TKEEMKMVNE TRKIMEADIK TTATCVRVPV 
FYGHSESVNV ETAKKITVAK ARELLEDAPG VELVDNPANG EYPMAMDAAG EDLTLVGRIR 
EDATVANGLN LWIVADNLRK GAATNAVQIA ELLVDEYLK