Gene GM21_3480 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3480
Symbol
ID	8138852
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	4026172
End bp	4027191
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	67%
IMG OID	644871100
Product	Threonine aldolase
Protein accession	YP_003023260
Protein GI	253702071
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2008] Threonine aldolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	0.000000277913
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAGACGG TAGATCTGAG AAGCGACACG GTGACATCGC CGTCGCAGGC AATGCGCCGG 
GAAATGGCGA ATGCCCCGGT CGGAGACGAC GTCTACGGGG AGGACCCGAC GGTGAACCGG 
TTGGAGTCCA TGGCGGCGAA GTTGCTGGGG AAGGAGGCGG CGCTCTTCGT CCCCACTGGG 
ACCATGGGGA ACCTGATCGC CCTTTTGTCG CACTGCGGCC GCGGCGACGA ATACATCGCG 
GGGCAGGAAG CGCACATCTA CCGGTGGGAG GGAGGAGGCG GGGCCGTCTT CGGCGGGATC 
CAGCCGCAGC CGGTCGAATT CGAAGAGAAC GGAACGCTCG ACCTCGACAA GGTGCGGCGC 
GTCGTGAAGC CGGCGGATTA CCATCACCCC GTCACCAGAC TCCTCTGCCT TGAGAACACG 
CAAGGGGGGA AGGTGTTGCC GCTCGACTAT CTGGCAAAGG CTGCGGAGAC GGCCCAAGGT 
CTCGGCCTTT CCCTGCATCT CGACGGCGCC CGGGTCTTCA ACGCGGCCGT GTACCTGGGG 
GTACCCGTCG CCACCATCGC CGCCCATTTC GACTCGGTCT CGGTCTGCCT CTCCAAGGGG 
CTCGGCGCCC CGGCCGGCAC GGTACTTTGC GCCAGCCGCG AGCTCATCGG CCGCGCGCGC 
CGCTGGCGCA AGGTGGCCGG CGGCGGCATG CGCCAGGCCG GCATCTTGGC CGCGGCAGGC 
ATTTACGCTC TGGAGAACAA CGTAGAGCGG CTCGCCGAGG ACCACGAGAA CGCGGAACTC 
CTTTCCGCCG GGCTTGGCCA CATCGAGGAA CTCCTGGTGA GCCAGGCCCG CACCAACATC 
CTCTTCGTCA CCCCCCCGGC CGGTAGCGCC GACCGGCTGC GCAAGACTCT CGCCGCCGAG 
GGGATACTCC TTGGAGGAGG CGACCAGATA CGCCTTGTCA CCCACCTGGA CGTAACCAGC 
GCCGACGTCG AGCGCACCGT CGCCGCCTTC AAACGCTTCT TTGCGGTACG GGGCAACTGA

Protein sequence

MKTVDLRSDT VTSPSQAMRR EMANAPVGDD VYGEDPTVNR LESMAAKLLG KEAALFVPTG 
TMGNLIALLS HCGRGDEYIA GQEAHIYRWE GGGGAVFGGI QPQPVEFEEN GTLDLDKVRR 
VVKPADYHHP VTRLLCLENT QGGKVLPLDY LAKAAETAQG LGLSLHLDGA RVFNAAVYLG 
VPVATIAAHF DSVSVCLSKG LGAPAGTVLC ASRELIGRAR RWRKVAGGGM RQAGILAAAG 
IYALENNVER LAEDHENAEL LSAGLGHIEE LLVSQARTNI LFVTPPAGSA DRLRKTLAAE 
GILLGGGDQI RLVTHLDVTS ADVERTVAAF KRFFAVRGN