Gene RPD_1503 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1503
Symbol
ID	4021982
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	1674859
End bp	1676292
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	67%
IMG OID	637961697
Product	aldehyde dehydrogenase
Protein accession	YP_568641
Protein GI	91975982
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACCAGC CGTTGAGCGG ATTCGGCGGC AACGCCCTGC AGGACAGCTT TCACCGGATG 
CTCGACCGCT CCCGAGCCGA AGCGCCGGCG ACGCTGGAGC AGCGGCTCGA CAGGCTGGCG 
CGGCTCCGCA GTGTTCTGAA GGACAATGAA AAGCGATTCG AGCAGGCGAT CTCCGCCGAT 
TTCGGCCATC GCTGCGCGAT CGAGACCATG ATCGCCGAGA CGCTCAGCCT GTTGGGCGAC 
ATCAAGCACA CCAGCAAGCA CGTCAAATCC TGGATGGCGC CGCGCAAGGT CGCGACCCAG 
CCGCAGTTCT GGCCGGGCAA GAACCGGCTG ATCCCGCAGC CGCTCGGCGT GGTCGGCATC 
ATCGCGCCGT GGAATTATCC GTTGCAGCTG ACGCTGGCGC CGGCGATCGG CGCGCTGGCC 
GCCGGCAACC GGGTGATGAT CAAGCCGAGC GAATTGTCGC CGGCGTTCTC GGCTCTGTTG 
CAGGAAACAA TCGCCGCAAA GTTCGACCCC GCCGAGATGA TCGTGACCGG GATCGAGGAC 
GGCGTCGCCG AGGCGTTCGC GAAGCTGCCG TTCGACCATC TGATGTTCAC CGGCTCAACG 
CGGGTGGGCC GGATCGTCGC AGAAGCCGCC GGGCGTAACC TCACGCCGGT CACGCTCGAG 
CTCGGCGGCA AATCCCCGAC CATCGTCGAC CGCTCCGCCG ACCTCGACGA GGTGGCGCCG 
CGGATCGCCT ACGCCAAGCT GATGAATGCG GGCCAGACCT GCATCGCGCC GGACTATGTG 
CTGGCGCCGC AAGCCGTGGT CGAGGCGCTG GCGGCAAAGA TCCGCGACGC GATGCAGCGG 
ATGTTCGGCT CCGATCCCGC CAACAAGGAC TACACCTCGA TTGTCGCCGA CCGGCATTAT 
GCGCGGCTGA AGGGCCTCGT CGACGACGCT GCGGCGCGCG GCGCGCGGCT GCTGCAGCCG 
GCCGCGGCCG ACGACGCGGC GTGGCAAGGA CAGCGCAAGT TTCCGCCCAC AGTCGTGCTC 
GGCGCCACGC CCGACATGAA GATCATGCAG GAAGAGATCT TCGGCCCGCT GTTGCCGATC 
CTCGGCTACG AGGATCCGGC CGAGCCGATC GCCTTCATCA ATGCCCGCGA CCGGCCGCTG 
GCGCTGTACT GGTTCGGCAA GGACGAGGCG GCGCGCGACG AGGTGCTGGC GCGGACCGTG 
TCCGGCGGCG TCACCATCAA CGACTGCCTG GTGCATTTCG CCCAGGTCAA CCAGCCGATG 
GGCGGCGTCG GCGCATCGGG AACGGGCTCC TATCACGGCG AATGGGGGTT CAACACCTTC 
ACCCAACTCA AGCCGGTGTT CTATCGCTCG CCCTATAACC GCTTCGCCGA TCTGTATCCG 
CCCTATGGCG GCAAAATCAC GCGGCTCGCG AAAGTGCTGC GCTGGATTTC CTGA

Protein sequence

MDQPLSGFGG NALQDSFHRM LDRSRAEAPA TLEQRLDRLA RLRSVLKDNE KRFEQAISAD 
FGHRCAIETM IAETLSLLGD IKHTSKHVKS WMAPRKVATQ PQFWPGKNRL IPQPLGVVGI 
IAPWNYPLQL TLAPAIGALA AGNRVMIKPS ELSPAFSALL QETIAAKFDP AEMIVTGIED 
GVAEAFAKLP FDHLMFTGST RVGRIVAEAA GRNLTPVTLE LGGKSPTIVD RSADLDEVAP 
RIAYAKLMNA GQTCIAPDYV LAPQAVVEAL AAKIRDAMQR MFGSDPANKD YTSIVADRHY 
ARLKGLVDDA AARGARLLQP AAADDAAWQG QRKFPPTVVL GATPDMKIMQ EEIFGPLLPI 
LGYEDPAEPI AFINARDRPL ALYWFGKDEA ARDEVLARTV SGGVTINDCL VHFAQVNQPM 
GGVGASGTGS YHGEWGFNTF TQLKPVFYRS PYNRFADLYP PYGGKITRLA KVLRWIS