Gene RSP_2372 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_2372
Symbol
ID	3719908
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_007493
Strand	+
Start bp	998596
End bp	1000014
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	71%
IMG OID	640070550
Product	aldehyde dehydrogenase (NAD-dependent)
Protein accession	YP_352431
Protein GI	77462927
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCAACA TCGACCGTTT CTTCATTGGC GGCGCCTGGA CGGCCCCCCT CGGCACCGAC 
CGGCACCGGC TGGTGAACCC GGCGACGGAG GAGGAGATCG CCGCGATCCC GATGGCCTCG 
ACCGAGGATG TCGACCGCGC CGTCACCGCG GCGCGCGCCG CCTTCGAGGG CTGGCAGGCC 
AGCTCGAAGG AGGAGCGTCT CCTCCTCCTC CGCCGTCTCC TCGATCTCTA CAACGAGGCC 
TACGACGAGC TGGCCGAGCT CATGACCCGC GAGATGGGCA CCGTCGCCCG CTTCAGTCGC 
GAGGCGCAGG CCTGGGTCGG GCGCGCCCAT TTGGAGGCCG CCATCGAGGC TCTCGAGGCC 
GAGAGCTTCG AGGAGATGCG CGGCTCGACC CTGATCTCGA AGGAGCCCAT CGGCGTCTGC 
GCCCTCATCA CGCCGTGGAA CTGGCCGATG AACCAGCTGG TCGTGAAGGT GGCCCCCGCC 
CTCGCCGCGG GCTGCACGGT GGTGGCGAAA CCCTCGGAAT TCTCGCCGCT CTCCTCGATC 
CGCTTCGCCG AACTGGTCGA GGCCGCGGGC TTTCCGCCGG GCGTCTACAA CCACATCACC 
GGCGCAGGCC CCGTCGCGGG CGAGGCGCTG GCGCGGCACC CGGACGTGGA CATGATCTCG 
ATCACCGGCT CGACCCGCGC AGGGATCGCG GTGGCGCGCG CGGCCGCCGA CACGGTCAAG 
CGCGTGACGC AGGAGCTCGG CGGCAAGTCG GCCAACATCA TCCTGCCCGA TGCGGATCTG 
GCCACCGCCG TCCGGCAGGG GGTGCTCGAC TGTTTCGGCA ATGCGGGACA GGCCTGCAAG 
GCGCCCGCGC GGATGCTGGT GCCGGCCGAG CGGATGGAGG AGGCCGCGGC CCTCGCAGGC 
GCGGCGGCCG AGGCGCTGAC GGTGGGGGCG CCCGAGGGCG AGGTCGATCT CGGCCCCGTC 
GTGAACGAAA GCCAGTGGCG CCGCATCCAG TCGCTGATCG AGGCGGGCAT CGCCGAGGGC 
GCGCGCCTCG TTACCGGGGG ACCGGGCCGG CCCGACCATC TGCCGCGTGG CTGGTATGTG 
CGCCCGACCG TCTTTGCCGA CGTGGCCCAT GGCTCGACCA TCGCCACCGA GGAGATCTTC 
GGCCCCGTCG TGGCCCTCAT TCCCTACCGG GACGAGGAAG AGGCGGTCCG CATCGCCAAT 
GACTCGATCT ACGGGCTTGC GGGCTATATC CAGACCGGCG ACCCCGAGAC GGCGCGGCGC 
ATCGCGCGGA AGCTGCGCGT GGGCATGGTC TATATCAACG GCGCGGGCTG GGACGCGCGC 
GCGCCCTTCG GTGGCTACAA GCAATCGGGC AACGGGCGCG AACACGGCGC CTGGGGCCTC 
GCCGACTACC TCGAGACGAA AGCCACGGCC GGATTGTGA

Protein sequence

MRNIDRFFIG GAWTAPLGTD RHRLVNPATE EEIAAIPMAS TEDVDRAVTA ARAAFEGWQA 
SSKEERLLLL RRLLDLYNEA YDELAELMTR EMGTVARFSR EAQAWVGRAH LEAAIEALEA 
ESFEEMRGST LISKEPIGVC ALITPWNWPM NQLVVKVAPA LAAGCTVVAK PSEFSPLSSI 
RFAELVEAAG FPPGVYNHIT GAGPVAGEAL ARHPDVDMIS ITGSTRAGIA VARAAADTVK 
RVTQELGGKS ANIILPDADL ATAVRQGVLD CFGNAGQACK APARMLVPAE RMEEAAALAG 
AAAEALTVGA PEGEVDLGPV VNESQWRRIQ SLIEAGIAEG ARLVTGGPGR PDHLPRGWYV 
RPTVFADVAH GSTIATEEIF GPVVALIPYR DEEEAVRIAN DSIYGLAGYI QTGDPETARR 
IARKLRVGMV YINGAGWDAR APFGGYKQSG NGREHGAWGL ADYLETKATA GL