Gene RPD_3587 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3587
Symbol
ID	4024101
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	3999364
End bp	4000464
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	69%
IMG OID	637963791
Product	malate/L-lactate dehydrogenase
Protein accession	YP_570711
Protein GI	91978052
COG category	[C] Energy production and conversion
COG ID	[COG2055] Malate/L-lactate dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.787615
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.77685
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGCGCG CCGACATGGT GACGGTGCAG GCGGACAGGC TGATCGATTT CGTCGCCCAG 
GTGTTCGAGC GCGCAGGTTC ATCCAAAGCC GAGGCGCGCC GGATCGGCAG TTACCTCACC 
ACCGCGAACC TCACCGGCCA CGACAGTCAC GGCGTGATCC GCGTGCCGGT GTATATCCGC 
TGGCGCAACG CTGGCGCCGT GCATCCGGAT CAGACGGTGG ATGTGCCGGT CGATCTGCCG 
TCGCTCGCGG TGGTCGACGG CAAGTTCGGC TACGGCCAGA CCGTCGGGCC GCAGGCGGTG 
CGGATCGGTA TCGAGAAGTG CAAGGCGCAG GGGCTGTCGG CGGTCGGCCT GAAGAATGCC 
GGGCATATCG GCCGGATCGG CGACTGGGCC GAGATGGCGG CGGCCGAAGG TCTGGTGTCG 
ATCCACTTCG TCACCGCGGC CGGCTCGATT CTGGTCGCGC CCTATGGCGG CGTCGAGCGG 
CGGTTGTCGA CCGCGCCGTA TTGCGTCGGC GTGCCGCGAC CGGGCGCCCC GCCGGTGGTG 
CTGGATTTCG CGACCTCGAT CGTCGCCGAG GGCAAGGTGC TGGTCGCGGC GCGCGGCGGC 
AAGGCCCTGC CGCAGGGCGC GCTGATCAAT CCGGACGGCA CCTTCAGCGA AGACCCGGCG 
ACGCTGTACG GCGCGTTCGA GAAAGACGGC CCGATCAACC ACGTCAACGG CGCCGGCGCG 
ATCCGCGCCT TCGGCGAGCA CAAGGGCTCG GGGCTGGCGC TGATCTGCGA GCTGCTCGGC 
GGCGCGTTGT CCGGCAACGG CGCCACCGGG CCGGACCGGC CGTTCGCGAA TGGCATGTTC 
TCGATCTATG TCGATCCGCA ACGGATCGAT CCCGCGCATG TGTTCGACGC CGAGGTCACG 
CGCTATGTCG ATTACTTCAA GAGCGCGAAG ACGGTCGCGG GCGTCGATCA GGTGCTGATC 
CCCGGCGATC CGGAATTGAA GACACGCGCC GATCGGACCG AGAACGGCGT GCCGCTTTCC 
GACGACACCT GGGCCGCCAT CGTCGCCACC GCCCGCGAGG TCGGAGTCGA CGAACGCGCG 
ATCGAGGCGG CGACGGCATG A

Protein sequence

MVRADMVTVQ ADRLIDFVAQ VFERAGSSKA EARRIGSYLT TANLTGHDSH GVIRVPVYIR 
WRNAGAVHPD QTVDVPVDLP SLAVVDGKFG YGQTVGPQAV RIGIEKCKAQ GLSAVGLKNA 
GHIGRIGDWA EMAAAEGLVS IHFVTAAGSI LVAPYGGVER RLSTAPYCVG VPRPGAPPVV 
LDFATSIVAE GKVLVAARGG KALPQGALIN PDGTFSEDPA TLYGAFEKDG PINHVNGAGA 
IRAFGEHKGS GLALICELLG GALSGNGATG PDRPFANGMF SIYVDPQRID PAHVFDAEVT 
RYVDYFKSAK TVAGVDQVLI PGDPELKTRA DRTENGVPLS DDTWAAIVAT AREVGVDERA 
IEAATA