Gene Gura_1033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gura_1033
Symbol
ID	5166784
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter uraniireducens Rf4
Kingdom	Bacteria
Replicon accession	NC_009483
Strand	+
Start bp	1234570
End bp	1236195
Gene Length	1626 bp
Protein Length	541 aa
Translation table	11
GC content	58%
IMG OID	640548529
Product	aldehyde dehydrogenase
Protein accession	YP_001229812
Protein GI	148263106
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACACTGA AAGAGAGGAT CGATAAATTG TTCCCGACGG AAGCGGAGAT AAGCAAGTCT 
TTCCGCCTGC CGGAACCGAT CGAGTTGAAC AGTTTTCTCA TCAACGGAGA ACTGCGCAGT 
TGGAACGGTC CCATGCAGGA GGTTTTTTCC CCGGTCTGCG TGAAGACCGA AGCGGGGCTT 
TTCCGGCAGA TGATCGGGAG GTTCCCGTTG ATGGCAGAGT CCGACGCGTT GTCTGTCCTT 
GATGCGGCAG TCGGGGCCTA CGACTGCGGC CGGGGGCGCT GGCCGACCAT GTCCGTTGAG 
GAGCGGATTG CCTGCGTTCA GGAATTCGCC TACCGGATGA AAGAAAAGCG GTCTGAGGTG 
GTGAGCCTTC TCATGTGGGA AATCGGCAAG TCGCTCAAGG ATTCCGAAAA GGAATTCGAC 
AGGACGGTCG ATTACATAGC CGATACCATC GATGCGCTGA AAGAACTGGA TCGGGTTTCG 
TCCCGGTTTG TCGTCGCCCA GGGGATCATC GGCCAGATCC GTCGCGCGCC GATAGGGGTC 
GCCCTTTGCA TGGGCCCCTA CAACTATCCC TTGAATGAAA CCTTCACCAC TCTGATTCCG 
GCATTGATCA TGGGGAATAC GGTTATCCTC AAGCCGCCGC GCCACGGGGT ACTCCTATTT 
TACCCCCTTC TGGAGGCGTT CCGCGATTCT TTCCCTCCCG GGGTGGTGAA CACGCTTTTC 
GGCGCCGGAA GGACGGTCAC TCCGCCGCTG ATGGCTTCCG GCAAGGTGGA CGTGCTCGCC 
TTCATCGGTA CGAGCAAGGC TGCCGATAGC TTGCAAAAAG GGCATCCCAG GATGCATCGG 
CTCCGCTTGG TGCTGGGGCT GGAGGCAAAA AATCCCGCCA TTGTCCTCCC TGACGCCGAC 
CTGGAGTCCG CTGTCGAGGA GTGTGTGGCC GGGAGCCTGT CGTTCAACGG CCAACGCTGC 
ACTGCAATCA AGATCGTTTT CGTTCACGAG AGCATTGCGG ATGAATTCCT CAGCCGCTTT 
GCAGCGGCAA TCGCCGTCAT GAAATGCGGT ATGCCATGGG AGTCGGGGGT CGGCATAACG 
CCGTTGCCGG AGCCGGGTAA GCCGGAATAT CTGTCCTGCC TGGTTGCAGA CGCCGTACGC 
CTTGGGGCAC GGGTAGCCAA TGAGGCGGGG GGGACGGTCA ACGGTACCTT TTTCTACCCG 
GCCCTGGTGT ATCCGGTAAC GGCGGAGATG AAGCTTTATA ATGAAGAGCA GTTCGGTCCT 
GTCATACCGG TCCTGCCGTT TACGGATATC GAGACGCCGA TCGAGTATCT CACGGCATCG 
GACTACGGCC AGCAGGTGAG TATTTTCGGC CGGGATGCAG CGGTTCTGGC AAAGCTCATC 
GATCCCCTGG TCAACCAGGT TTCCCGCGTC AATATCAACA GCCAGTGCCA GCGTGGCCCG 
GATATCTTCC CCTTTACGGG CAGGAAAGAT TCGGCGGTCG GCACCCTCTC CGTTTCCGAT 
GCCCTGCGGG CCTTTTCCAT CCGCACCCTC GTGGCCGCCA GAGATACCGA ACTCAATAAG 
GAGATCATTC GCACTATCGT CCGCGAGCAA AAATCCAACT TTCTTTCCAC GGATTTCATT 
CTGTAA

Protein sequence

MTLKERIDKL FPTEAEISKS FRLPEPIELN SFLINGELRS WNGPMQEVFS PVCVKTEAGL 
FRQMIGRFPL MAESDALSVL DAAVGAYDCG RGRWPTMSVE ERIACVQEFA YRMKEKRSEV 
VSLLMWEIGK SLKDSEKEFD RTVDYIADTI DALKELDRVS SRFVVAQGII GQIRRAPIGV 
ALCMGPYNYP LNETFTTLIP ALIMGNTVIL KPPRHGVLLF YPLLEAFRDS FPPGVVNTLF 
GAGRTVTPPL MASGKVDVLA FIGTSKAADS LQKGHPRMHR LRLVLGLEAK NPAIVLPDAD 
LESAVEECVA GSLSFNGQRC TAIKIVFVHE SIADEFLSRF AAAIAVMKCG MPWESGVGIT 
PLPEPGKPEY LSCLVADAVR LGARVANEAG GTVNGTFFYP ALVYPVTAEM KLYNEEQFGP 
VIPVLPFTDI ETPIEYLTAS DYGQQVSIFG RDAAVLAKLI DPLVNQVSRV NINSQCQRGP 
DIFPFTGRKD SAVGTLSVSD ALRAFSIRTL VAARDTELNK EIIRTIVREQ KSNFLSTDFI 
L