Gene RPD_0099 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_0099
Symbol
ID	4020555
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	115231
End bp	116484
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	66%
IMG OID	637960276
Product	aspartate kinase
Protein accession	YP_567240
Protein GI	91974581
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0527] Aspartokinases
TIGRFAM ID	[TIGR00656] aspartate kinase, monofunctional class [TIGR00657] aspartate kinase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.211168
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCCGGC TGGTGATGAA ATTCGGCGGC ACGTCCGTCG CCAATATCGA GCGCATCCAG 
AACGTCGCGC GGCACGTCAA GCGCGAGGTC GATGCGGGGC ATGAGGTCGC CGTGGTGGTG 
TCGGCGATGT CCGGCAAGAC CAACGAGCTG GTCGCCTGGT GCCGTGAAGC CTCGCCGATG 
CATGACGCGC GCGAATACGA CGCCGTGGTG GCGTCCGGCG AGCAGGTGAC GTCGGGTCTG 
CTGGCGATCG CCCTTCAGGC GGTCGGTATC CAGGCGCGGT CCTGGCAGGG CTGGCAGCTG 
CCGATCAGCA CCAGCGACGC CCACGCCTCG GCCCGGATCA CCGACATCGA CGGCAGCGAG 
ATCATCAAGC GATTCGGCGA CCGCAAGGAA GTCGCGGTGA TCGCCGGCTT CCAGGGCATC 
AATCCCGAGA CCGGCCGCAT CACCACGCTC GGCCGCGGCG GTTCCGACAC CTCGGCGGTG 
GCGATCGCGG CGGCGCTGAA GGCGGACCGC TGCGACATCT ACACCGATGT CGACGGCGTC 
TACACCACCG ACCCGCGGGT GGTGCCGAAG GCGAAGCGGC TCGACAAGGT CGCGTTCGAG 
GAAATGCTGG AACTGGCGTC GCAGGGCGCC AAGGTGCTGC AGGTCCGCTC GGTCGAGCTC 
GGCATGGTGC ACAACATGCC GATCTTCGTG CGGTCCTCGT TCGACAAACC GGAAGACATC 
GATCCGCACG GCACGCCGCC GGGCACGCTG ATCTGCAGCG AGGAGATTAT CATGGAGAAC 
CACGTCGTCA CCGGCATCGC CTTTTCCAAG GACGAAGCCC AGATCTCGGT GCGCCGGATC 
GAGGACAAGC CGGGCGTGGC GGCGTCGATC TTCGGGCCGC TGGCCGACGC CAACATCAAT 
GTCGACATGA TCGTGCAGAA CGTGTCGGAG GACGGCAAGA CCACCGACCT GACCTTCACC 
GTGCCGGCCG CCGACTTCGC CCGCGCCAAG CAGACCATCA CCTCGGCGCA GGAAGAGATC 
GGCTACGCCC GCTTCGACAG CGAGACCGAC GTCGCCAAGG TGTCGGTGAT CGGCTCGGGG 
ATGCGCAGCC ATGCCGGCGT CGCGGCCCAG GCGTTCGCCG CGCTGGCCGC GCGGAACATC 
AATATTCGCG CCATCACCAC CTCGGAGATC AAGTTCTCGG TGCTGATCGA CGCCGCCTAC 
ACCGAACTCG CGGTGCGGAC GTTGCATACT TTGTACGGGT TGGATCAAGT TTAG

Protein sequence

MGRLVMKFGG TSVANIERIQ NVARHVKREV DAGHEVAVVV SAMSGKTNEL VAWCREASPM 
HDAREYDAVV ASGEQVTSGL LAIALQAVGI QARSWQGWQL PISTSDAHAS ARITDIDGSE 
IIKRFGDRKE VAVIAGFQGI NPETGRITTL GRGGSDTSAV AIAAALKADR CDIYTDVDGV 
YTTDPRVVPK AKRLDKVAFE EMLELASQGA KVLQVRSVEL GMVHNMPIFV RSSFDKPEDI 
DPHGTPPGTL ICSEEIIMEN HVVTGIAFSK DEAQISVRRI EDKPGVAASI FGPLADANIN 
VDMIVQNVSE DGKTTDLTFT VPAADFARAK QTITSAQEEI GYARFDSETD VAKVSVIGSG 
MRSHAGVAAQ AFAALAARNI NIRAITTSEI KFSVLIDAAY TELAVRTLHT LYGLDQV