Gene Rsph17029_0855 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_0855
Symbol
ID	4897794
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	+
Start bp	872410
End bp	873861
Gene Length	1452 bp
Protein Length	483 aa
Translation table	11
GC content	71%
IMG OID	640111440
Product	betaine aldehyde dehydrogenase
Protein accession	YP_001042738
Protein GI	126461624
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR01804] glycine betaine aldehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGAGCCC AGCCCGCCGC CAGCCATTTC GTCGACGGTC GTCCGCTCGA GGATGAGACC 
GGCGCGCCGA TCCCGGTGAT CTATCCCGCC ACCGGCGAGG AGATCGCCCG CCTTCACGAG 
GCCACGCCCG CCGTGATCGA GGCGGCTTTG GCCTCGGGCG CCCGCGCGCA GGCGGCCTGG 
GCCGCGATGC GGCCCGTCGA GCGGGCGCGG ATCCTGCGCC GCGCCTCGGA CCTGATCCGG 
GCGCGCAACG AGGAGCTGAG CCTTCTCGAG ACGCTTGACA CCGGCAAGCC GCTGCAGGAG 
ACGCTGGTGG CCGACTGGGC CTCGGGGGCG GATGCGCTGG AATTCTTCGC CGGTCTGGCG 
CCCGCCGTCA CCGGCGAAAC CGTGCCGCTG GGGCAGGATT TCGTCTATAC GATCCGCGAG 
CCGCTGGGCC TTTGCGTGGG CATCGGCGCC TGGAACTACC CGAGCCAGAT CGCCTGCTGG 
AAGGCTGCGC CCGCGCTCGC GCTCGGCAAT GCGATGGTGT TCAAGCCCTC GGAGGTGACG 
CCGCTCGGCG CGCTGAAGCT GGCCGAGATC CTGATCGAGG CGGGCCTGCC GCCCGGGCTC 
TTCAACGTGG TGCAGGGCCG CGGCGCGGTG GGGGCGGCGC TCGTCACCGA CAGCCGGGTG 
GCCAAGGTCT CGCTCACGGG CTCGGTGCCG ACGGGGCGGC GCGTCTATGC GGCTGCGGCC 
GAGGGCGTGC GCCATGTCAC GATGGAGCTC GGCGGCAAGT CGCCCCTGAT CGTCTTCGAC 
GATGCCGATC TGGAGAGCGC CATCGGCGCG GCGATGCTCG GCAACTTCTA TTCCGCGGGC 
CAGATCTGCT CGAACGGGAC GCGGGTCTTC GTGCAGAAGG GGATCAAGGA GGCGTTCCTC 
GCCCGGCTCG CCGAGCGGGC CGATGCCATC CGCATGGGCG ATCCGCTCGA CCCCGAGGTG 
CAGATGGGTC CGCTCGTCTC GCAGGCGCAG CTCGAGAAGG TGCTGGCCTA TATCGAGAAG 
GCCCGCGCCG AGGGCGGCCG CCTCGTCTGC GGCGGCGAGG CCTCGGTCAG CCCCGGCTGC 
TATGTCCAGC CCACGGTCTT CGCCGATGTG ACGGACGCCA TGACCCTCGC CCGCGAGGAG 
GTGTTCGGTC CGGTGATGGC GGTGCTCGAT TTCGAGACCG AGGAGGAGGC GATCGCGCGG 
GCGAATGCCA CGGACTTCGG CCTCGCCGCG GGCGTCTTCA CCGCGGATCT CACGCGGGCG 
CACCGGGTGG TGGCGCAGCT GCAGGCCGGG ACCTGCTGGA TCAACGCCTA CAACCTCACG 
CCGGTCGAGG CGCCCTTCGG CGGGGTGAAA CTGTCGGGCG TGGGCCGCGA GAACGGCCGC 
GCCGCCGTCG AGCACTATAC GCAGGTAAAG TCGGTCTATG TCGGCATGGG GCCGGTGGAC 
GCCCCCTACT GA

Protein sequence

MRAQPAASHF VDGRPLEDET GAPIPVIYPA TGEEIARLHE ATPAVIEAAL ASGARAQAAW 
AAMRPVERAR ILRRASDLIR ARNEELSLLE TLDTGKPLQE TLVADWASGA DALEFFAGLA 
PAVTGETVPL GQDFVYTIRE PLGLCVGIGA WNYPSQIACW KAAPALALGN AMVFKPSEVT 
PLGALKLAEI LIEAGLPPGL FNVVQGRGAV GAALVTDSRV AKVSLTGSVP TGRRVYAAAA 
EGVRHVTMEL GGKSPLIVFD DADLESAIGA AMLGNFYSAG QICSNGTRVF VQKGIKEAFL 
ARLAERADAI RMGDPLDPEV QMGPLVSQAQ LEKVLAYIEK ARAEGGRLVC GGEASVSPGC 
YVQPTVFADV TDAMTLAREE VFGPVMAVLD FETEEEAIAR ANATDFGLAA GVFTADLTRA 
HRVVAQLQAG TCWINAYNLT PVEAPFGGVK LSGVGRENGR AAVEHYTQVK SVYVGMGPVD 
APY