Gene GM21_3352 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3352
Symbol
ID	8138719
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	3878910
End bp	3880007
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	64%
IMG OID	644870970
Product	aspartate-semialdehyde dehydrogenase
Protein accession	YP_003023135
Protein GI	253701946
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0136] Aspartate-semialdehyde dehydrogenase
TIGRFAM ID	[TIGR01745] aspartate-semialdehyde dehydrogenase, gamma-proteobacterial

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	65
Fosmid unclonability p-value	0.0858212
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGTCG GACTGGTCGG TTGGCGTGGC ATGGTAGGCT CCGTTTTGCT CCAGCGCATG 
CAGGAGGAAA ACGATTTCCA GGGAATAGAG CCGGTTTTCT TCACAACCTC GCAGGTGGGG 
CAGCCCGCCC CGATGAACGC CGGGACCCTG AAGGACGCCT CGGATATCAA CGAGCTTAAG 
AAGCTGGACG TGATCATCAC CTGCCAGGGT GGCGACTACA CCAAGGCGGT GCGCCCGGAG 
CTGAACAAGG CGGGATGGAA GGGGTACTGG ATCGATGCTG CCAGCACGCT CCGCATGGAG 
AACGACGCCG TCATCATCCT CGACCCGATC AACCGCAACG TCATCGACGC TGCCCTTGCC 
AAAGGGGTCA AGGACTACAT CGGCGGCAAC TGCACCGTGA GCCTCATGCT CATGGGCCTG 
GGCGGGCTCT TCAAGGCGGG TGCCGTCGAG TGGATCAGCT CCATGACCTA CCAGGCGGCC 
TCCGGCGCGG GCGCTCCCAA CATGCGCGAG CTCCTCTCCC AGATGGGCGT ATTGCAGGGC 
TCGGTAGCGG ATCTCCTGGC GACCCCGGGC TCCGCCATCC TGGAGATCGA CCGCAAGGTG 
ACCCAGACCC TGAGGGGAGG GGATCTCCCG ACCAAGGAGT TCGGTTTCCC GCTGGCGGGG 
AGCGTCCTTC CCTGGATCGA CCGCGAGGTC GAGGACGGGC AGAGCCGCGA GGAGTGGAAA 
GGGTACGCCG AGACCAACAA GATCCTCGGC ACCGCGAACC CGATCCCGGT CGACGGCATC 
TGCGTCCGCG TGGGCGCCAT GCGCTGCCAC AGCCAGGCGC TGACCATCAA GCTGAACAAG 
GACATCCCCA TCGGCGAGAT CGAGCAGATG ATCAAGAACG ACAACCAGTG GGTCAAGTTC 
GTCCCCAACA CCAAGGCGGA GACCCTGGCT CAGTGCACCC CGGCAGCCGT TTCCGGTTCG 
CTCACCGTGC CGGTAGGCCG CGTGAGGAAG ATGAAGATGG GGCCGCAGTA TCTCTCCGCC 
TTCACCTGCG GCGATCAGCT CCTTTGGGGC GCCGCAGAGC CGCTGCGCCG CATGCTTCAG 
ATACTCAAGG AGCGGTAA

Protein sequence

MKVGLVGWRG MVGSVLLQRM QEENDFQGIE PVFFTTSQVG QPAPMNAGTL KDASDINELK 
KLDVIITCQG GDYTKAVRPE LNKAGWKGYW IDAASTLRME NDAVIILDPI NRNVIDAALA 
KGVKDYIGGN CTVSLMLMGL GGLFKAGAVE WISSMTYQAA SGAGAPNMRE LLSQMGVLQG 
SVADLLATPG SAILEIDRKV TQTLRGGDLP TKEFGFPLAG SVLPWIDREV EDGQSREEWK 
GYAETNKILG TANPIPVDGI CVRVGAMRCH SQALTIKLNK DIPIGEIEQM IKNDNQWVKF 
VPNTKAETLA QCTPAAVSGS LTVPVGRVRK MKMGPQYLSA FTCGDQLLWG AAEPLRRMLQ 
ILKER