Gene RPD_4089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_4089
Symbol
ID	4024606
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	4544791
End bp	4546098
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	69%
IMG OID	637964292
Product	dihydrodipicolinate reductase
Protein accession	YP_571209
Protein GI	91978550
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4091] Predicted homoserine dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCTTC ATCATCTGCT CGCCGCCCGC GCCGACGCCG GCCGGCCGGT TCGCGTCGCA 
CTGATCGGCG CCGGCAAATT CGGCTCGATG TTTCTCGCCC AGACGCCGCA CACCCGCGGG 
CTCGAGGTGG CGGCGATCGT CGATCTCGAT CCCGAGCGCG CCCGTGACGC CTGCCGCCAT 
GTCGGCTGGG ACGAAGGCAG GATCGCGGCG ACGCGCTTCG ACAGCGATCC GGCCGCGGCG 
AATGCCGCCG GCATCGAGGT CGTGGTCGAA GCGACCGGCA ATCCCGCCGC CGGCATCCGC 
CATGCGCGCG CGGCGATCGC CGCCGGACAG CATGTGGTGA TGGTCAATGT CGAGGCCGAC 
GTGCTGGCGG GGCCGCTGCT CGCCGACGAG GCGCGGCGCG CCGGCGTGGT CTATTCGCTG 
GCCTATGGCG ATCAGCCGGC GCTGACCGCC GAGCTGGTGG ACTGGGCGCG CGCGACCGGA 
TTCCGCGTCG TCGCCGCCGG CAAGGGCACC AAATATCTGC CGATCTATCA CGACGTCACG 
CCGGCCGGGG TGTGGAGCCA TTACGGTCTT TCCGCCGCCG AGGCGCAATC GGCCGGGATG 
AATCCGCAGA TGTTCAACTC GTTTCTCGAC GGCACGAAAT CCGCGATCGA AATGGCGGCG 
ATCGCCAATG CGACCGGACT CGACGTGCCT GCAGCCGGGC TCGCTTTTCC GCCCTGCGGG 
GTCGACGATC TGCCGCATGT GCTGCGGCCG CGCGGAGATG GCGGGGTGCT GGAGCGATCC 
GGCATGGTCG AAGTGGTGTC GTCGCTGGAG CGTGACGGCC GACCGGTGTT CCGCGATCTG 
CGCTGGGGCG TCTATGTGGT GATCGAAGCG CCGAACGATT ACGCCGCCGA TTGCTTCAAG 
CAATACGGGC TGAAGACGGA TTCGAGCGGC CGCTACGCCG CGATGTACAA GCCGTATCAC 
CTGATCGGGC TCGAGCTCGG CATTTCGGTG CTGTCGGCGG CGCTGCGGCG CGAACCGACT 
GGGCAGCCGC GCGACTTCCG CGGCGATGTC GTCGCGGTGG CGAAGCGGGA TCTGAAAGCC 
GGCGAAATGC TCGACGGCGA AGGCGGCTAT ACGGTGTGGG GGAAGTTGAT GCGCGCATCC 
GACAGCCTGA CGGCCGGCGC GCTGCCGATC GGGCTCGCGC ACCGGGTCAG ACTGACCAGC 
GATGTCGGCC ACGGCGGTGT GGTGCGCTGG TGTGACGTCG AGATCGACAA GAGCGATCCG 
ACCGTGGCGA CCAGGCGGGC GATGGAGCAG GCATTTTCGG GACGCTGA

Protein sequence

MNLHHLLAAR ADAGRPVRVA LIGAGKFGSM FLAQTPHTRG LEVAAIVDLD PERARDACRH 
VGWDEGRIAA TRFDSDPAAA NAAGIEVVVE ATGNPAAGIR HARAAIAAGQ HVVMVNVEAD 
VLAGPLLADE ARRAGVVYSL AYGDQPALTA ELVDWARATG FRVVAAGKGT KYLPIYHDVT 
PAGVWSHYGL SAAEAQSAGM NPQMFNSFLD GTKSAIEMAA IANATGLDVP AAGLAFPPCG 
VDDLPHVLRP RGDGGVLERS GMVEVVSSLE RDGRPVFRDL RWGVYVVIEA PNDYAADCFK 
QYGLKTDSSG RYAAMYKPYH LIGLELGISV LSAALRREPT GQPRDFRGDV VAVAKRDLKA 
GEMLDGEGGY TVWGKLMRAS DSLTAGALPI GLAHRVRLTS DVGHGGVVRW CDVEIDKSDP 
TVATRRAMEQ AFSGR