Gene GSU1108 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU1108
Symbol
ID	2688555
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	1194322
End bp	1195749
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	57%
IMG OID	637125777
Product	aldehyde dehydrogenase family protein
Protein accession	NP_952161
Protein GI	39996210
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00189493
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAAAGC GCTATAAGGT TCTTGTTGGT GGTGAGTGGA CAGGGGACGA CCGACCGGGT 
ATCGAGGTCG TAAACCCTTA CGACGATTCG GTCATAGGGG TTGTGCCCGA GGCAACGAAC 
GAGGATGTTG ACCACGCCAT ACGTGCAGCA CAGGCGGGCT TTGCCGAAAT GTCCGCTCTC 
CCGGCGTATC GACGTTCCGA CATACTTGAT CGTACTTCGG AGCTGATCAA GCGAGACCGG 
GAGGAGATCG CCGAAATAAT TGCCCGCGAA GCGGGCAAGT CGTGGAAATT CGCCCTTGCG 
GAAGCGGATA GAAGTGCAGA GACCTTCCGT TTCGCCTCGC TGGAGGCTCG TAACGCCCAC 
GGCGAAATCG TACCCATGGA TGCTTCGCCT GTGTCAGCTG GTCGTTTCGG TTTCTACCTC 
AGAACCCCGA TCGGCGTAAT CGGTGCCATC GCACCCTTTA ACTTTCCTCT TAACCTGGTT 
GCACACAAGG TGGCACCCGC CATAGCCGCC GGTAACGCGA TAGTGCTGAA GCCTGCCACA 
AAGACTCCCC TCTCGTCCAT TAAGCTTGCG GAGCTTATGG TGGAGGCGGG GCTCCCTGCC 
GGTGCGCTCA ATCTGGTTAT CGGGAGCGGT CGGACTGTCG GTAACCGTTT GGTAGAGGAT 
GATCGGCTGG CAATGGTGAC ATTCACCGGA AGCCCGCCGG TTGGCGTTCA AATCAAGGAG 
CGGAGCGGAC TCAAGAGAGT TACGCTGGAG CTTGGGTCCA ATTCACCCAC CATCATTGAG 
GATGATGGCG ATGTGGATGC GGCAGTCGCC CGCTGTGTAG TGGGCAGTTT CGCCAACTCG 
GGGCAGGTCT GTATCTCTGT TCAGCGAATT TTTGTACACC AGCGGCGTTA TCGCGAATTT 
GTTGACAAGT TTGTGGCCGC GACCCAAAAG CTCAAGGTTG GGGATCCTAT GGACCGTGAC 
TGCGACATCG GACCGATGAT TTCCCGCGAA GAGCTGCAGC GCGCCGTCGA GTGGCTGGGT 
GAGGCCACGT CTCTGGGGGC GAGACTTGAA ACCGGGGGTA CGGTTGCCGG CAACTGTCTC 
ACTCCGGCAA TTCTGAGCGG CGTAACTCCC GACATGAAGG TGGTCTGCTC CGAGGTGTTT 
GCGCCGATTG TTTCCGTCAT CCCTTATGAG ACCTTCGATC AGGCCCTCGA TATGGCTGAC 
GACTCAATCT ATGGCCTTCA GGCCGGGGTT TACACCAGCG ACATCAATAA GGCGTTCAAG 
GCCATCCGCC GACTCGATGT GGGAGGAGTA ATCATTAACG ATATTCCGAC GTTCAGGGTC 
GATCATATGC CCTATGGCGG TAACAAGCAG AGTGGACTCG GGCGGGAAGG TATCCGCTAC 
GCCATGGAAG AGATGACGAA CATAAAATTT GTGTGCTTGA ATCTATGA

Protein sequence

MAKRYKVLVG GEWTGDDRPG IEVVNPYDDS VIGVVPEATN EDVDHAIRAA QAGFAEMSAL 
PAYRRSDILD RTSELIKRDR EEIAEIIARE AGKSWKFALA EADRSAETFR FASLEARNAH 
GEIVPMDASP VSAGRFGFYL RTPIGVIGAI APFNFPLNLV AHKVAPAIAA GNAIVLKPAT 
KTPLSSIKLA ELMVEAGLPA GALNLVIGSG RTVGNRLVED DRLAMVTFTG SPPVGVQIKE 
RSGLKRVTLE LGSNSPTIIE DDGDVDAAVA RCVVGSFANS GQVCISVQRI FVHQRRYREF 
VDKFVAATQK LKVGDPMDRD CDIGPMISRE ELQRAVEWLG EATSLGARLE TGGTVAGNCL 
TPAILSGVTP DMKVVCSEVF APIVSVIPYE TFDQALDMAD DSIYGLQAGV YTSDINKAFK 
AIRRLDVGGV IINDIPTFRV DHMPYGGNKQ SGLGREGIRY AMEEMTNIKF VCLNL