Gene RPD_3688 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3688
Symbol
ID	4024204
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	4114949
End bp	4116496
Gene Length	1548 bp
Protein Length	515 aa
Translation table	11
GC content	68%
IMG OID	637963892
Product	hypothetical protein
Protein accession	YP_570810
Protein GI	91978151
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0028] Thiamine pyrophosphate-requiring enzymes [acetolactate synthase, pyruvate dehydrogenase (cytochrome), glyoxylate carboligase, phosphonopyruvate decarboxylase]
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGAACG GTGCCGAGAG CCTGGTGCGG ACGCTTGTTC ATGGCGGCGT CGATGTTTGT 
TTCGCCAACC CCGGCACCTC GGAAATGCAC TTCGTGGCGG CCCTCGACCG CGTCGAGGGG 
ATGCGCTGCG TGCTCGGGCT GTTCGAGGGC GTCGTCACCG GCGCCGCCGA TGGCTATTAC 
CGGATGAAGC GCACGCCGGC GTCGACCTTG CTGCATCTCG GCCCCGGCCT CGCCAACGGC 
CTCGCCAATC TGCACAACGC CAAGAAGGCG AATTCCGGCA TCGTCAATAT CGTCGGCCAA 
CATGCCACCT ACCACATCGA TTACAACGCG CCGCTGACCT CCGACATCGA GGGACTGGCT 
CGGCCGATGT CGGCGTGGGT TCGCACTTCT CCGGACGCCC AATCGGTGGC GCGCGACGGC 
GCCGCCGCGA TCGCCGCGGC AAAAAGTGCG CCGCCGCAGA TCGCCACGCT GATCCTGCCG 
GCCGACACCG CCTGGAACGA GGCCGATGGC ATCGCCGACG TGCCGGCAGA CGCGCAGCGC 
CCGAGCTACT CGCCGCATGC CGTCGAGGCG GCGGCGCGGG TGCTGCGCTC CGGCGAGCCG 
ACGCTGCTGC TGCTGACCGG CGGTGCGCTC ACCGAGCACG GCCTCGACCT CGCGGCGCGG 
ATCGCCGGCA AGAGCGGCTG CCGTGTGATG GGCCAGACCT ACAATCCGCG GATGGCGCGC 
GGCCGGGGTC GCTATTCGAT CGAGCGGATT CCCTATGTGA TCGAATCCGC GCTGCCGATC 
CTCAAGGACT TCCGCCATAT CGTGCTGGTC GAGGCCAACG ACCCGGTGGC GTTCTTCGCC 
TATCCGAACA AGCCGAGCCT GCTGAAGCCT GAGGGCTGCG AGGTGCATCG CATGACCGAG 
GGCGGCGAGA ATTCAGTTGC CGCGCTGGAA GCGCTCGCCG GCGCGCTCGG CGCCAAGGCG 
CAGGACGCGC AGCCGCAAAC GCTCGCCGAG ATCGCGCGGC CGACCGGCGC GCTGACTCAT 
GCCTCGATCG CGCAGGCGAT TGCGATGGCA ATCCCGGAGA ACGCCATCGT GATCGACGAA 
TCGATCACTA CCGGCCGCGG GTTCTTTCCG CCGACGGCTG CGGCGCCGCC GCACGACTGG 
CTGCAGAACA TGGGCGGTTC GATCGGCTTT TCGCCGCCGG TCGCGGTCGG CGCCGCGGTG 
GCGTGCCCGG ATCGCAAGGT GATCTGCTTG GTCGGCGACG GCAGCGCGAT GTACACGCTG 
CAGGCGCTGT GGACGCAGGC GCGCGAAAAC CTCGACGTGA CCACGGTGGT GTTCGCCAAC 
CGCAAGTACC AGATCCTGCG CGGCGAATTC GACGGCGTCG GCGCCGGGGA GCCCGGCCAG 
CGCGCGCAGG ACATGCTGAC GCTCGATCGG CCGGCGCTCG ACTGGGTGTC GCTCGCCAGG 
GGCATGGGAG TTCCGGCCCG CGCCGTCTCG AGCGCTGACG AGCTGAACAA GGCTCTGGAT 
GCCGGCACCG GCGGCAGCGG ACCGAATCTG ATCGAAGTTC AAATGTAA

Protein sequence

MMNGAESLVR TLVHGGVDVC FANPGTSEMH FVAALDRVEG MRCVLGLFEG VVTGAADGYY 
RMKRTPASTL LHLGPGLANG LANLHNAKKA NSGIVNIVGQ HATYHIDYNA PLTSDIEGLA 
RPMSAWVRTS PDAQSVARDG AAAIAAAKSA PPQIATLILP ADTAWNEADG IADVPADAQR 
PSYSPHAVEA AARVLRSGEP TLLLLTGGAL TEHGLDLAAR IAGKSGCRVM GQTYNPRMAR 
GRGRYSIERI PYVIESALPI LKDFRHIVLV EANDPVAFFA YPNKPSLLKP EGCEVHRMTE 
GGENSVAALE ALAGALGAKA QDAQPQTLAE IARPTGALTH ASIAQAIAMA IPENAIVIDE 
SITTGRGFFP PTAAAPPHDW LQNMGGSIGF SPPVAVGAAV ACPDRKVICL VGDGSAMYTL 
QALWTQAREN LDVTTVVFAN RKYQILRGEF DGVGAGEPGQ RAQDMLTLDR PALDWVSLAR 
GMGVPARAVS SADELNKALD AGTGGSGPNL IEVQM