Gene Rpal_4679 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_4679
Symbol
ID	6412365
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	5039698
End bp	5040438
Gene Length	741 bp
Protein Length	246 aa
Translation table	11
GC content	66%
IMG OID	642714558
Product	haloacid dehalogenase, type II
Protein accession	YP_001993645
Protein GI	192293040
COG category	[R] General function prediction only
COG ID	[COG1011] Predicted hydrolase (HAD superfamily)
TIGRFAM ID	[TIGR01428] 2-haloalkanoic acid dehalogenase, type II [TIGR01493] Haloacid dehalogenase superfamily, subfamily IA, variant 2 with 3rd motif like haloacid dehalogenase [TIGR01509] haloacid dehalogenase superfamily, subfamily IA, variant 3 with third motif having DD or ED [TIGR01549] haloacid dehalogenase superfamily, subfamily IA, variant 1 with third motif having Dx(3-4)D or Dx(3-4)E

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCATTG CCGCCGTCGT GTTCGATGCC TATGGCACGC TGTACGACAT CCAATCGGTT 
GCGACTGTCA CCGAGCGGGA GTTTCCGGGC TACGGCGAGG TGATCACGCA GATCTGGCGG 
ATCAAGCAGC TCGAATACAC TTGGCTGCGC TCGCAGATGG GGACCTACGA AGACTTCGCC 
GTCGTCACCC GTGATTCGCT CGCCTACACG CTCGACTGTC TCGGCATCGA GGCTGGCGGC 
GGCGCGTTCG AGCGGATCTT CGCCAAATAT CTCGATCTCA CGCTCTATCC CGAAGCGCTG 
GCGGCGCTGG AGGCACTCGC GTCCTGCAAG CGAGCGATCC TGTCCAACGG CAGCCCAGAT 
ATGCTTGGCG CCCTCACCCG CAACACCGGC CTCGACCGCG TGCTCGACGA CGTGATCAGT 
GTCGACGCCG CCAAGGTGTT CAAGCCGCAT CCGCGCGCCT ATGCGCTGGC CGAGGCACGG 
CTCGGCGTGG CGCCGCGTGA GATGTTGTTC GTGTCTTCGA ATCCCTGGGA CGTGGCGGGC 
GCGAAAGCGT TCGGCTTCAA CGTCGCCTGG ATCGAGCGCG TCAGCCGCGA GGCAATGGCG 
CGCGAACTGC GACGGCCAGG GCCGCTGCCA CCGCAGACGT TGTTCAAGGC GCTGCGCACC 
CAGATGGACG TGCTCGGCTT CGAGCCCGAC CACCGCATCG GCTCGCTGAC GGCGCTGGTG 
GAGATCGTCG CCGGCCGCTG A

Protein sequence

MPIAAVVFDA YGTLYDIQSV ATVTEREFPG YGEVITQIWR IKQLEYTWLR SQMGTYEDFA 
VVTRDSLAYT LDCLGIEAGG GAFERIFAKY LDLTLYPEAL AALEALASCK RAILSNGSPD 
MLGALTRNTG LDRVLDDVIS VDAAKVFKPH PRAYALAEAR LGVAPREMLF VSSNPWDVAG 
AKAFGFNVAW IERVSREAMA RELRRPGPLP PQTLFKALRT QMDVLGFEPD HRIGSLTALV 
EIVAGR