Gene RPC_2006 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_2006
Symbol
ID	3973869
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	+
Start bp	2182072
End bp	2183316
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	68%
IMG OID	637925116
Product	acetate kinase
Protein accession	YP_531881
Protein GI	90423511
COG category	[C] Energy production and conversion
COG ID	[COG0282] Acetate kinase
TIGRFAM ID	[TIGR00016] acetate kinase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.479503
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCTATA CGTCGCAACT CGTCCTGGTG ATCAATTGCG GATCCTCGTC GCTCAAATTC 
GCGGTGATTC CCGCGCTCGG CGGCGCGCCG CTGGCGAGCG GTTTGGCGGA ATGTCTCGGG 
CTTGCCGAGG CGAGGCTGGT GATCAAGTCC GGCGAGACCA AGACCAGCAA TTCGCTGCAC 
GGCGGCGCCC ATGACGCGGC GCTGGCGGCG ATCCTGCGTT ATCTCGACGA GCAAAGCCTG 
CTCGATCGCA TCGTCGTGGT CGGGCATCGC GTCGTGCACG GCGGCGAGCG CTTCACCGCG 
TCCGCTTTGG TGACGCCGGA AGTTCTCGCC GACATCGAGG CGGTGTCGGC GCTGGCGCCG 
CTGCACGGCC CGGCCAATCT GCTCGGCATC CGCGCCTGCT CGCAAGGGTT GCCGTCGGTG 
CCGCAGGTGG TGGTGTTCGA CACCGCGTTC CATCAGACCA TGCCGTGCGC GGCATTCACC 
TACGCGATCC CGCAGCACCT CTATCGCGAC TTCGGCGTGC GGCGTTACGG CTTCCACGGC 
ACCTCGCATC GCTACGTCGC CCGCCAGGCG GTCGAGCTGC TGCGGCTCGA TCCGCAGGAT 
CATGGCATCG TCATCGCGCA TCTCGGCAAC GGCGCCTCGG CGACCGCGGT CAGCAACGGC 
GAGAGCGTCG ACACCACCAT GGGGATGACC CCGATCGAGG GCCTGGTGAT GGGCACCCGC 
TGCGGCGACA TCGACTTCGG CGCGGTGGCG CATATCGCCC GCACCGCGCG GCTGAGCCTC 
GACGAGGTCG ACGCCATGCT CAATAAAGAA AGCGGGCTGC TCGGCATTTC CGAACTGTCG 
AGCGACTGCC GCACGCTGGA GCAGGCCGCC AAATCCGGCC ACGCCGGCGC CATCCTGGCG 
CTCGACGTGT TCGTGCACCG GCTGGCGCGC CACATCGGCG GGCTCGCCGC CTCGCTGGAT 
AATTTCGACG CCTTGGTGTT CACCGGCGGC ATCGGCGAGA ACTCGGCGCT GATCCGCGCC 
AAGACCATCG AGAGCCTGCG AGTGTTCGGC TTCACGCTGA ACCGCGAGGC CAACGAGCGG 
ATGTTCGGCG GCCGTTCCGG CCGGATCAGC CGCAGCCGGC GGCCGACCGC CGTGGTCATC 
CCCACCGATG AAGAAGGCCT GATCGCCAAC GACGCCGCGA CCCTGGTCGG CATCTTTCCC 
TCGGCAAGCG CTCCGGCGCA GCCCCACGAC CTTCACTTCG CCTGA

Protein sequence

MSYTSQLVLV INCGSSSLKF AVIPALGGAP LASGLAECLG LAEARLVIKS GETKTSNSLH 
GGAHDAALAA ILRYLDEQSL LDRIVVVGHR VVHGGERFTA SALVTPEVLA DIEAVSALAP 
LHGPANLLGI RACSQGLPSV PQVVVFDTAF HQTMPCAAFT YAIPQHLYRD FGVRRYGFHG 
TSHRYVARQA VELLRLDPQD HGIVIAHLGN GASATAVSNG ESVDTTMGMT PIEGLVMGTR 
CGDIDFGAVA HIARTARLSL DEVDAMLNKE SGLLGISELS SDCRTLEQAA KSGHAGAILA 
LDVFVHRLAR HIGGLAASLD NFDALVFTGG IGENSALIRA KTIESLRVFG FTLNREANER 
MFGGRSGRIS RSRRPTAVVI PTDEEGLIAN DAATLVGIFP SASAPAQPHD LHFA