Gene RPB_2001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_2001
Symbol
ID	3909507
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	2273447
End bp	2274436
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	69%
IMG OID	637883895
Product	D-alanine--D-alanine ligase
Protein accession	YP_485620
Protein GI	86749124
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1181] D-alanine-D-alanine ligase and related ATP-grasp enzymes
TIGRFAM ID	[TIGR01205] D-alanine--D-alanine ligase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGACAGA CAATTCTCTT CGGCGGCACC AGCAAGGAGC GCCTGGTTTC GGTCGCCTCG 
GCGCAGGCGC TGCACGCCGC GCTGCCCGAT GCCGAATTGT GGTTCTGGAA CGACGACGAC 
AGCGTCCACG CGGTGACCGC GGAGGCGCTG CTGGCGCATG CGCGGCCGTT CGAGGAGGCG 
TTTCGGCCGG CTGGCGAAAA CATCGGTCCG CTGGAGCGCG CGCTCGATCG CGCGGCGATC 
GAACAGCGGC TGCTGGTGCT GGGTCTGCAC GGCGGTGTCG CCGAGAACGG CGAGTTGCAG 
GCGATGTGCG AGATGCGCGG CGTGCCGTTC ACCGGGTCGG GCGCGGCGGC GTCGCATCTC 
GCCTTCGACA AGGTGGCCGC CAAGCGGTTC GCCGCGATCG CCGGCGTGCG CGCGCCGGCC 
GGCATCGCGC TGGCGGAGGC CGAGGCGGCG CTGGCCGCCC ACGGCCGGCT GATCGCCAAG 
CCGGCCCGCG ACGGGTCGAG CTACGGCCTG TTCTTCATCA ATGCGAAGCA GGACCTGGTC 
GCGGTGCGCG ACGCGGCGAG GTCCGAGGAC TATCTGATCG AGCCGTTCGT CTCCGGCATC 
GAAGCGACCT GCGGCGTGCT GGAGCAGGCC GACGGCTCGC TGCTGGCGCT GCCGCCGATC 
GAGATCGTGC CGGCCGACGG CGGCTTCGAC TACACCGCGA AATATCTCGC CAAATCGACC 
CAGGAGATCT GCCCCGGCCG GTTCGCGCCG CAGATCTCGG CGAGGATCAT GGAGGATGCC 
GTGAAGGCGC ATCGGGTGAT GGGCTGCCGC GGCTATTCGC GCTCCGACTT CATCGTCGTC 
GCCGACGGTC CGATCTTTCT CGAGACCAAT ACGCTGCCCG GACTGACCAA GGCCTCGCTC 
TATCCCAAGG CGCTGCAGGC GCAGGGGATC GCCTTCGTCG ATTTCCTCCA CGGCCAGATC 
GCGCTCGCCG AACGCGGCGC CCGGCGTTAA

Protein sequence

MRQTILFGGT SKERLVSVAS AQALHAALPD AELWFWNDDD SVHAVTAEAL LAHARPFEEA 
FRPAGENIGP LERALDRAAI EQRLLVLGLH GGVAENGELQ AMCEMRGVPF TGSGAAASHL 
AFDKVAAKRF AAIAGVRAPA GIALAEAEAA LAAHGRLIAK PARDGSSYGL FFINAKQDLV 
AVRDAARSED YLIEPFVSGI EATCGVLEQA DGSLLALPPI EIVPADGGFD YTAKYLAKST 
QEICPGRFAP QISARIMEDA VKAHRVMGCR GYSRSDFIVV ADGPIFLETN TLPGLTKASL 
YPKALQAQGI AFVDFLHGQI ALAERGARR