Gene RPC_1964 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_1964
Symbol
ID	3973637
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	+
Start bp	2136672
End bp	2138192
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	64%
IMG OID	637925075
Product	aldehyde dehydrogenase
Protein accession	YP_531840
Protein GI	90423470
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGTACG CCGCTCCCGG CACCGCCGGA GCCCCAGTCG ATTTCAAGTC GCGCTACGAC 
AATTTCATCG GCGGCCGCTG GTCGGCGCCG GTGAACGGCC GCTATTTCGA CAGCGTCACC 
CCGATCACCG GGCAAGCCTT TACCCAGGCT GCACGTTCGG ATGAAGTTGA TATCACGCTC 
GCGCTCGACG CCGCTCACGC CGCCGCCGAT GCCTGGGGCC GCACCAGCGT CGCCGAACGC 
GCGCTGGTGC TGAACCGCAT CGCCGACCGC ATGGAAGAGA ATCTCGAACG GCTCGCTTAT 
GCGGAGTCCG TCGACAACGG CAAGCCGATC CGCGAGACGC TGGCCGCCGA CATTCCGTTG 
GCGATCGATC ATTTCCGTTA CTTCGCCTCG TGCGTCCGCT CGCAAGAAGG CACGCTGGCG 
CAGCTCGACG AACACACCGT CGCCTATCAC TTCCACGAGC CGCTCGGCGT GGTCGGCCAG 
ATCATTCCGT GGAATTTCTC GATCCTGATG GCGGCGTGGA AATTGGCGCC GGCGTTGGCC 
TCCGGCAACT GCATCGTGCT GAAGCCCGCC GAGCAGACTC CGATCAGCAT CCTGGTGCTG 
GTGGAGCTGA TCGCCGATCT GCTGCCGCCG GGCGTGCTCA ACGTGGTCAA CGGCTTCGGC 
CTGGAGGCGG GCAAGCCGCT GGCGTCTTCG AACCGCATCT CCAAGATCGC TTTCACCGGC 
GAGACCAGCA CCGGCCGGCT GATCATGCAA TACGCCAGCG CCAATCTGAT CCCGGTGTCG 
CTCGAGCTGG GCGGCAAGTC GCCGAACATC TTCTTCGACG ACGTCGCCGC TTCGGACGAC 
GCTTACTTCG ACAAGGCGAT CGAGGGCTTC GTGATGTTCG CGCTCAACCA GGGCGAGGTC 
TGCACCTGTC CGTCGCGCGC GCTGATTCAG GAGTCGCTGT ACGACCGCTT CATCGATCGG 
GCGCTGGCGC GGGTGACGGC GATCCGTCAG GGCAATCCGC TCGACACCGA GACCATGATC 
GGAGCTCAAG CCTCCTCCGA GCAGATGGAG AAGATCCTGT CTTACTTCAC CATCGGCCGC 
GACGAGGGCG CCAAGGTGCT GACCGGCGGC GCGCGCGCCG AGCTCGGCGG CGATCTCGCC 
GAGGGCTACT ACGTCCAGCC GACCGTGCTG AAGGGGCACA ACCGGATGCG GGTGTTCCAG 
GAAGAGATCT TCGGGCCGGT CGTCGCGGTC ACCACCTTCA AGGATGAGGA CGAGGCGCTG 
CATCTGGCCA ACGACACCCA TTATGGCCTC GGTGCCGGCG TCTGGACCCG CGATGGCAAC 
CGGGCCTACC GCTTCGGCCG CGGCATCAAA GCGGGCCGGG TGTGGACCAA CTGCTACCAC 
CTCTATCCGG CGCATGCGGC GTTCGGCGGC TACAAGCAAT CCGGGATCGG CCGTGAAAAC 
CATCACATGA TGCTAGACCA TTATCAGCAG ACCAAGAACC TGCTGGTCAG CTACAGCCCC 
GACGCGCTGG GCTTCTTCTA A

Protein sequence

MKYAAPGTAG APVDFKSRYD NFIGGRWSAP VNGRYFDSVT PITGQAFTQA ARSDEVDITL 
ALDAAHAAAD AWGRTSVAER ALVLNRIADR MEENLERLAY AESVDNGKPI RETLAADIPL 
AIDHFRYFAS CVRSQEGTLA QLDEHTVAYH FHEPLGVVGQ IIPWNFSILM AAWKLAPALA 
SGNCIVLKPA EQTPISILVL VELIADLLPP GVLNVVNGFG LEAGKPLASS NRISKIAFTG 
ETSTGRLIMQ YASANLIPVS LELGGKSPNI FFDDVAASDD AYFDKAIEGF VMFALNQGEV 
CTCPSRALIQ ESLYDRFIDR ALARVTAIRQ GNPLDTETMI GAQASSEQME KILSYFTIGR 
DEGAKVLTGG ARAELGGDLA EGYYVQPTVL KGHNRMRVFQ EEIFGPVVAV TTFKDEDEAL 
HLANDTHYGL GAGVWTRDGN RAYRFGRGIK AGRVWTNCYH LYPAHAAFGG YKQSGIGREN 
HHMMLDHYQQ TKNLLVSYSP DALGFF