Gene RPC_0454 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_0454
Symbol
ID	3970216
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	489560
End bp	491053
Gene Length	1494 bp
Protein Length	497 aa
Translation table	11
GC content	65%
IMG OID	637923570
Product	succinic semialdehyde dehydrogenase
Protein accession	YP_530348
Protein GI	90421978
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR01780] succinate-semialdehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGACCA CCGCTGCCGC CCGTTCCCAA TCCACTGCGC TTTCGCTGCG CGATCGTCTG 
AAGCATCCCG CGCTGTTGCG CGAGGCCTGC TACATCGACG GGCAATGGAC CGGCACGCCT 
GAGACCGTTG TCAGCAACCC GGTCAACGAC CTCGAACTCG GCCGGGTGCC GAAGCTCGGA 
GCGACCGAAG CCACGCAGGC GGTGGAAGCG GCGCAACGTG CGTTTCCGGC CTGGGCTAAA 
CTCACCGCCA AGCAGCGCTC CAACATCATG CGCAAATGGT ACGAACTGAT CGTCGCCAAC 
CGCGAAGATC TGGCGCTGAT CCTCACTTCC GAACAAGGCA AGCCGCTGAC CGAAGCACTC 
GGCGAAGTCG ACATCGGCGC CGCCTATGTG GAGTTCTTCG CCGAGGAAGC CCGCAGGGTT 
TATGGCGAGA CCATTCCGAC GCAGCGGCCG GATGCCCGGC TGATCGCCAT CAAGCAGCCG 
ATCGGGGTGT GCGGCGCGAT CACGCCGTGG AATTTTCCCA ATTCGATGAT CACCCGCAAG 
GTGTCGCCGG CGCTCGCCGC CGGCTGCACC GTGGTACTGA AGCCCGCCAA CGAGACGCCG 
TTCTCGGCGC TGGCGCTCGC CGCCTTGGCG GAGCAGGCCG GACTGCCGAA CGGCGTGTTC 
AACATCGTCA CCGGCCACGC CTCGGCGATC GGCAAGGTGT TGTGCGAGCA TCCGGCGGTG 
CGCTTCGTCG GCTTCACCGG CTCCACCGAA GTCGGCAAGA TCCTGTATCA GCAGGCCGCG 
GTGGGCGTGA AGAAGCTCGG GCTCGAGCTC GGCGGCAACG CGCCGTTCAT CGTGTTCGAC 
GACGCCGATG TCGATGCCGC GGTGGACGGC GCGATGGTGT CGAAATATCG CAACATGGGC 
CAGACCTGCG TCTGCGCCAA CCGGATCTAC GTCCAGGACG GCGTCTATGA CGCCTTTGTC 
GAGAAACTCG CCGCCAAGGT CGGCGCCATG ACAATCGGCG ACGGCACCGA GCCCGGCGTC 
ACCCAAGGCC CGCTGATCAA TCAGGCCGCG GTGGAGAAGA CCGAGCGCCA CATCGCCGAC 
GCCGTTGCCA ACGGCGCCAC CATCGTGATC GGCGGCAAGC GCCATGCGCG CGGCGGCACG 
TTCTTCGAGC CGACCGTGCT CGCCAACGTC AAGCCCGACG CGCTGGTGGC GCATGAGGAA 
ACTTTTGGCC CGCTGGCGCC GGTGTTCCGC TTCAAAACCG AAGAGGAAGT GATCAAGCTC 
GCCAACGACT CGCCTTTCGG GCTCGCCTCC TACTTCTACG CCCGCGATCT CGGCCGGGTG 
TGGCGCGTCG CTGAAGCGCT GGAGGCCGGC ATGGTCGGCG TCAATTCCGG GCTGATCACC 
ACCGAAGTGG CGCCGTTCGG CGGCGTCAAG GAAAGTGGCC TCGGCCGCGA AGGCTCGCAT 
CACGGCATGG AGGACTATGT CGAGATCAAA TACGTGATGA TGGCGGGGAT TTGA

Protein sequence

MSTTAAARSQ STALSLRDRL KHPALLREAC YIDGQWTGTP ETVVSNPVND LELGRVPKLG 
ATEATQAVEA AQRAFPAWAK LTAKQRSNIM RKWYELIVAN REDLALILTS EQGKPLTEAL 
GEVDIGAAYV EFFAEEARRV YGETIPTQRP DARLIAIKQP IGVCGAITPW NFPNSMITRK 
VSPALAAGCT VVLKPANETP FSALALAALA EQAGLPNGVF NIVTGHASAI GKVLCEHPAV 
RFVGFTGSTE VGKILYQQAA VGVKKLGLEL GGNAPFIVFD DADVDAAVDG AMVSKYRNMG 
QTCVCANRIY VQDGVYDAFV EKLAAKVGAM TIGDGTEPGV TQGPLINQAA VEKTERHIAD 
AVANGATIVI GGKRHARGGT FFEPTVLANV KPDALVAHEE TFGPLAPVFR FKTEEEVIKL 
ANDSPFGLAS YFYARDLGRV WRVAEALEAG MVGVNSGLIT TEVAPFGGVK ESGLGREGSH 
HGMEDYVEIK YVMMAGI