Gene RPB_3497 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3497
Symbol
ID	3911299
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	4002275
End bp	4003342
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	65%
IMG OID	637885399
Product	choloylglycine hydrolase
Protein accession	YP_487103
Protein GI	86750607
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3049] Penicillin V acylase and related amidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTGCAT TCAGGCGTCG TTTCGTGACC GTCTCCATCG CCGCACTGCT TGCCAGCGGC 
GCCCTGCTCG CGCCCGCTGC GAAAGCCTGC ACCCGCCTGG TCTATCTCGG CGCCGGCGAT 
CAGGTGATCA CCGCGCGCTC GATGGACTGG GCGCGCGACA TCGGCACCAA TCTCTGGATC 
TTCCCGCGCG GCATCAAGCG CTCCGGCGAG GCCGGGCCGA ATTCGGCACA ATGGACCGCG 
CGCTACGGCA GCGTGATCGC CTCGGCCTAC GACATCGCGA CCTCGGACGG CGTCAACGAG 
GCCGGCCTGG TGGCCAACGT GCTGTGGCTG GCGGAATCGA CCTATCCGAA GCTCGACGGC 
GGCAGGCCCG GCCTCGCGCT GTCGCTGTGG CCGCAATACG TGCTCGACAA TTTCGCCAAT 
GTGCAGGAGG CGGTCGCGGC GCTGGCGAAG GAACCGTTCA CCGTGGTCAC TGCGCAACTC 
CCCGACGAGA ACCGGCTGGC GACCGTGCAC CTGTCGCTGT CGGACAAAAG CGGCGATAGC 
GCCATCATCG AATATATCGA CGGCAAGCAG GTGATCCATC ACGGCCGGCA GTATCAGGTG 
ATGACCAATT CGCCGACCTT CGATCAGCAG CTCGCGCTCA ACGCCTACTG GAAGCAGATC 
GGCGGCACCG TGATGCTGCC GGGCACCAAC CGCGCCGCGG ACCGCTTCGC CCGCGCCTCG 
TTCTATGTCG ATGCGATCCC GAAAGCGGAG AATCCGGTCG AAGCCATCGC CAGCGTGTTC 
GGCGTGATCC GCAACGCCTC GGTGCCCTAC GGCATCACCA CGCCCGACCA GCCGAACATC 
TCCTCGACGC GCTGGCGCAC CGTGGTCGAT CACAAGCGCA AACTGTACTT CTTCGAATCC 
GCGCTGACCC CGAACGTGTT CTGGGTCGAC CTGACCAAAA TCGACTTCTC GGCCGACAAG 
GGCACGGTGC AGAAGCTCGA CCTCGGCCCC GGCCAGAGCA ACACCTTCTC CGGCGAGGTC 
CACGACCGCT TCAGGCCGAG CGAGCCGTTC AAGTTTCTCG GGCTGTGA

Protein sequence

MIAFRRRFVT VSIAALLASG ALLAPAAKAC TRLVYLGAGD QVITARSMDW ARDIGTNLWI 
FPRGIKRSGE AGPNSAQWTA RYGSVIASAY DIATSDGVNE AGLVANVLWL AESTYPKLDG 
GRPGLALSLW PQYVLDNFAN VQEAVAALAK EPFTVVTAQL PDENRLATVH LSLSDKSGDS 
AIIEYIDGKQ VIHHGRQYQV MTNSPTFDQQ LALNAYWKQI GGTVMLPGTN RAADRFARAS 
FYVDAIPKAE NPVEAIASVF GVIRNASVPY GITTPDQPNI SSTRWRTVVD HKRKLYFFES 
ALTPNVFWVD LTKIDFSADK GTVQKLDLGP GQSNTFSGEV HDRFRPSEPF KFLGL