Gene Gura_1870 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gura_1870
Symbol
ID	5166871
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter uraniireducens Rf4
Kingdom	Bacteria
Replicon accession	NC_009483
Strand	-
Start bp	2170404
End bp	2171471
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	57%
IMG OID	640549361
Product	threonine aldolase
Protein accession	YP_001230633
Protein GI	148263927
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2008] Threonine aldolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.163709
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCGTG CCGATCTTCA AAAACCGCTG CAGCATCATC AGTTTGCCAG CGACAATTAC 
GCCGGGATCT GCCCGGAAGC AATGCAGGCG ATGGCGGAAG CAAATCGCGG CTACGCCTCA 
TCGTACGGAG ACGACTACTG GACCGGCAAG GCCTGCGAAC GGCTGCGGGA GCTCTTTGAG 
ACCGACTGCG AGGTGTTTTT CGTCTTTAAC GGCACGGCAG CCAACTCTCT GGCGCTTGCT 
TCGCTCTGCC AGTCCTATCA CAGCATCATC TGCCACGAAA TGGCGCACAT CGAAACCGAC 
GAGTGCGGCG CTTCCGAGTT TTTCTCCAAC GGCACCAAGG TTTTGCTGGT GCATGGTGAA 
AACGGAAAGG TCGATCTCGG AGAAATTGAA CATACGGTTC AGCGCCGCAC GGACATCCAC 
TATCCGAAAC CGCGTGCGCT GAGTATAACC CAGGCAACGG AACTGGGCAC GGTCTACACC 
GTTGATGAAA TGCAGGCGAT CGGCGAGGTT GCCAGGCGTT TTTCTCTGCG GATTCATATG 
GACGGAGCCC GTTTCGCCAA TGCCATAGCG TCCTTGAACG TCGCACCGAA GGAAATCACA 
TGGAAAGCGG GGGTGGATGT GCTCTGTTTC GGCGGAACGA AAAACGGCTT CGCCATGGGC 
GAAGCCGTCA TTTTCTTTAA CCGCGAACTG GCATTCGAGT TCGACTACCG TTGCAAACAG 
GCTGGGCAAC TCGCCTCAAA GATGCGCTAC CTTGCCGCTC CATGGATCGG CACCCTGGAA 
AGCGGCGCCT GGCTGCGTCA TGCTGCCCAT GCCAATGCCT GCGCCCGGAA GCTGGAAAAA 
GAGCTGCAAT CCATTGCCGG CATCAGAGTC ATGTTCCCCT GCCAGGCAAA CTCCGTATTT 
CTGGAGATGC CGCCAACGCT GATGGAAGCG CTGCGCAACC GCGGCTGGCA CTTTTACACC 
TTCATCGGCT CTGGAGGCGC CCGCTTCATG TGCTCATGGG AAACCAGCGA TGCGGACATC 
GCCGCTCTGG TGAAGGACAT CCGCGAACTG GTGCAACAGA ATACCTAG

Protein sequence

MKRADLQKPL QHHQFASDNY AGICPEAMQA MAEANRGYAS SYGDDYWTGK ACERLRELFE 
TDCEVFFVFN GTAANSLALA SLCQSYHSII CHEMAHIETD ECGASEFFSN GTKVLLVHGE 
NGKVDLGEIE HTVQRRTDIH YPKPRALSIT QATELGTVYT VDEMQAIGEV ARRFSLRIHM 
DGARFANAIA SLNVAPKEIT WKAGVDVLCF GGTKNGFAMG EAVIFFNREL AFEFDYRCKQ 
AGQLASKMRY LAAPWIGTLE SGAWLRHAAH ANACARKLEK ELQSIAGIRV MFPCQANSVF 
LEMPPTLMEA LRNRGWHFYT FIGSGGARFM CSWETSDADI AALVKDIREL VQQNT