Gene RPD_4029 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_4029
Symbol
ID	4024546
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	4477435
End bp	4478415
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	65%
IMG OID	637964232
Product	homoserine kinase
Protein accession	YP_571149
Protein GI	91978490
COG category	[R] General function prediction only
COG ID	[COG2334] Putative homoserine kinase type II (protein kinase fold)
TIGRFAM ID	[TIGR00938] homoserine kinase, Neisseria type

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGTCT ATACCGACGT CGCCGCCGAC GAACTCGCGG ACTTTCTCAA GGCCTACGAG 
ATCGGCGACC TGCTATCCTA CAAAGGCATC GCCGAGGGCG TCGAGAACTC CAACTTCCTG 
CTGCATACCA CGCGCGGCCA CTTCATCCTG ACGCTGTACG AAAAGCGCGT CGCCGCCGAC 
GACCTGCCGT ATTTTCTGTC GCTGATGGCG CATCTCGCCG CGCGCGGCGT CAGTTGCCCG 
CAGCCGGCGA CGAATCGTGC GGGCGAAGTC TGCGGGACGT TGTCCGGCCG CCCGGCGGTG 
ATCATCAATT TCCTCGAAGG CGTCTGGCCG CGCCGGCCTA ATCTGGCCCA CTGCGCAGGC 
GTCGGCGAGG CGATGGCGAA GATGCACCGC GCAGGCCTGG ACTATCCCTC CTACCGCTCT 
AATCCGCTGT CGGTGACAGG CTGGCGGCCG CTGTTCAACA TCGCGGCCTC GCGGGCCGAC 
GAGATCCAGC CCGGCCTGCG CGATTTCATC GCCGCCGAAC TCGATTATCT CGAAGGCAAC 
TGGCCCGATC AATTGCCGAC CGGCGTGATC CACGCCGATC TGTTTCCGGA CAATGTGTTC 
TTCATCGGCG ACAAGCTGTC GGGGCTGATC GACTTTCCGT TCTCCTGCAA CGATATCCTC 
GCCTACGACG TGGCGATCTG CCTGAACGCC TGGTGCTTCG AGCCGGATCT TTCGTTCAAC 
GTCACCAAGG CCCGGGCGCT GCTCAACGCC TATCAGCGTG AACGCGCGTT GAGCGAGGCC 
GAGCAGGCGG CGCTGCCGTT GCTGGCGCGC GGCGCGGCGA TGCGCTTCCT GCTGACGCGG 
CTGGTCGATT TCCTCGACGT GCCGGCGGGC GCGCTGGTCC GCCCGAAGGA TCCGCTGGAA 
TACGTCCGCA AGCTGCGCTT CCAGCAGAAC GTCGCCGGCA TTCGCGACTA CGGCGTCGAA 
GCGGCGGGAG CAGTGGCGTG A

Protein sequence

MAVYTDVAAD ELADFLKAYE IGDLLSYKGI AEGVENSNFL LHTTRGHFIL TLYEKRVAAD 
DLPYFLSLMA HLAARGVSCP QPATNRAGEV CGTLSGRPAV IINFLEGVWP RRPNLAHCAG 
VGEAMAKMHR AGLDYPSYRS NPLSVTGWRP LFNIAASRAD EIQPGLRDFI AAELDYLEGN 
WPDQLPTGVI HADLFPDNVF FIGDKLSGLI DFPFSCNDIL AYDVAICLNA WCFEPDLSFN 
VTKARALLNA YQRERALSEA EQAALPLLAR GAAMRFLLTR LVDFLDVPAG ALVRPKDPLE 
YVRKLRFQQN VAGIRDYGVE AAGAVA