Gene RPD_4035 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_4035
Symbol
ID	4024552
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	4484618
End bp	4486003
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	67%
IMG OID	637964238
Product	peptidase M16-like
Protein accession	YP_571155
Protein GI	91978496
COG category	[R] General function prediction only
COG ID	[COG0612] Predicted Zn-dependent peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.291122
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAATGT CCATTGCTCG CCCGCGCGCC GCGCTCGCCG TTCTCGCCGC CACCCTCTGC 
CTTGCGGGTC CCGCGGCGGC GCAAAGCGTC ACCGCCGATC CGCCCGCCAC CTTCACGCTC 
GGCAACGGGC TGAACGTGGT GGTGATCCCG GATCATCGCA CCCCGGTGGT GACGCAGATG 
ATCTGGTACA AGGTCGGCTC CGCTGACGAG ACGCCCGGCA AGTCCGGACT CGCGCATTTC 
CTCGAGCATC TGATGTTCAA GGGCACCGCC AAGCACCCGG CCGGCGAGTT CTCGCAGACG 
GTGCTGAAGA TCGGCGGCAA CGAGAACGCA TTCACTTCGG TCGACTACAC CGGCTATTTC 
CAGCGCGTGC CGCGCGAACA TCTCGACCGG ATGATGGAGC TCGAGGCCGA TCGGATGACC 
GATCTGGTGC TGAAGGACGA GAACGTGCTG CCGGAGCGCG ACGTCGTCCT CGAAGAATAC 
AACATGCGGG TCGCCAACAA TCCCGACGCG CGGCTGACCG AGCAGATCAT GGCGGCGCTG 
TATCTCAACC ACCCCTATGG CCGCCCGGTG ATCGGCTGGC ACCAGGAAAT CCAGAAGCTC 
GACCGCGAGG ATGCGCTGGC GTTCTATCGC CGCTTCTACG CGCCGAACAA CGCCACCCTG 
GTGATTGCCG GCGACGTCGA TGCCGCGCAG ATCCGGCCGG CGATCGAGCG CACGTACGGC 
GCGATCCCGC CGCAGCCGGC GATCGCGGCG CAGCGCGTGC GCCCGCAGGA GCCGACCTCC 
GCCGGGCCGC GCACGGTGAC GCTGGCCGAT CCGCGGGTCG AGCAGCCGAG CGTGCGGCGC 
TATTATCTGG CGCCGTCGGC GGTCACCGCC GCCAAGGGCG ACAGCCCCGC GCTCGAAGTG 
CTGGCGCAGC TGATGGGTGG TGGCAGCAAC TCCTATCTCT ACCGCGCGCT GGTGATCGAC 
CGTCCGCTCG CGATCAGCGT CGGCGCCAAC TATCAAGGCA CCGCGCTCGA CGACAGCCAA 
TTCGTGATCG CGGCGACGCC GAGGCCGGGC GTCGAGTTCT CCGAGATCGA GAAGGGGATC 
GACAACGTGA TCGCCGAACT CGTCCGCAAT CCGGTCCGCT CCGAGGACCT CGAGCGGGTG 
AAGACGCAAC TGATCGCCGA GGCGATCTAT GCGCAGGACA ATCAGGTGAC GCTGGCGCGC 
TGGTACGGCG CGGCGCTGAC CTCCGGTCTC AGCGTGCAGG ACATCCAGAC CTGGCCGGAT 
CGCATCCGCG CCGTCACCTC GGACCAGGTC CGCGCCGTGG CGCAGCAGTT CCTCGACCGC 
AACCGCTCGG TCACCGGCTA TCTGGTCAAG GGCACGTTGC CGAAGCCCGA GGAGAAGCGC 
TCGTGA

Protein sequence

MTMSIARPRA ALAVLAATLC LAGPAAAQSV TADPPATFTL GNGLNVVVIP DHRTPVVTQM 
IWYKVGSADE TPGKSGLAHF LEHLMFKGTA KHPAGEFSQT VLKIGGNENA FTSVDYTGYF 
QRVPREHLDR MMELEADRMT DLVLKDENVL PERDVVLEEY NMRVANNPDA RLTEQIMAAL 
YLNHPYGRPV IGWHQEIQKL DREDALAFYR RFYAPNNATL VIAGDVDAAQ IRPAIERTYG 
AIPPQPAIAA QRVRPQEPTS AGPRTVTLAD PRVEQPSVRR YYLAPSAVTA AKGDSPALEV 
LAQLMGGGSN SYLYRALVID RPLAISVGAN YQGTALDDSQ FVIAATPRPG VEFSEIEKGI 
DNVIAELVRN PVRSEDLERV KTQLIAEAIY AQDNQVTLAR WYGAALTSGL SVQDIQTWPD 
RIRAVTSDQV RAVAQQFLDR NRSVTGYLVK GTLPKPEEKR S