Gene Plav_0844 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plav_0844
Symbol
ID	5456343
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Parvibaculum lavamentivorans DS-1
Kingdom	Bacteria
Replicon accession	NC_009719
Strand	-
Start bp	915941
End bp	918040
Gene Length	2100 bp
Protein Length	699 aa
Translation table	11
GC content	64%
IMG OID	640876415
Product	oligopeptidase B
Protein accession	YP_001412124
Protein GI	154251300
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1770] Protease II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	0.740368
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACTCA CACCTCCCGC CGTTGCGCCC CTGGCCCCGA AGCGGCCGCA GACGGATGTG 
CATCACGGCA TTTCGCGGAC CGACGATTAT GCGTGGCTGC GCGACGAGAA CTGGCGCGAG 
GTGATGCGCG ATCCGGCGGT TCTCGATACC GACATCCGCG CCTATCTCGA CGCCGAGAAC 
GCCTATACGG AAGCGGCGCT CAAACCTGTC GCCGAATTGC GCGAGACACT CTTCAAGGAG 
ATGAAGGGGC GGATCAAGGA GGATGACAGC TCCGTGCCGT CGCCCGACGG CGCTTTTGCC 
TATTACACGC GCTTTGTCGA AGGGGCGCAG CATCCGCTTT TCTGCCGCAG GCCGCGAGAG 
GCGGAAGCGG GCGAGGAAAT ATTGCTTGAC GCGAACAAGG AAGCGGAGGG CGAGGCCTAT 
TTCAAGATCG GCGATGTGGA CCATGCGCCG ACGCACAAGC TGATCGCATG GTCGGCGGAC 
CGCAAGGGCT CGGAATATTT CACGGTGCGG CTGCGCGACG CCGCGACGGG GAAGGACCTC 
GCCGACGAGG TGCCGGACAC TTCGCCCGGC ATCGCATGGG ACGCGGCGGG CACGAGCTTT 
CTCTATACGC AGGTGGATGA CGAACACCGG CCGCTGAAAG TGTTCCGCCA TGTCGTCGGC 
ACGGCGGCGA GCGAAGACAC ACTCGTCTAT GAAGAAGAGG ACGAAGGCTT TTTCGTCGGC 
GTGGGGAAGA CGCAGAGCGG CAAGTGGCTC GTCATTTCAA GCCATGACCA CCAGACCAGC 
GAATGCAGGC TGATCCCCGC CGATGCGCCG GAGACTGCGC CGCTGCTCGT TGCGCCGCGC 
GAGGAGGCTG TCGAATACGA TATCGAGCAT GACGAACCGC GAGAACGCTT CCTCATTCTC 
ACGAATGCGG ACGGGGCGGA GGACTTCAAG ATCGTTGAGG CGCCCGAGGC GGCGCCCGGA 
CGCGAGAACT GGCGCGACTT CGTGCCCCAC CGGCCGGGGA CGCTGGTGCT GCATCATGTG 
GCCTATCGCG GGCATCATGT GCGGCTCGAA CGGCGGGACG GGCTGCCGCG CATTGCGGTG 
CGGCGGCTTG CGGACGGCGC GGAACATGAG ATCGGCTTCG ACGAGGAAGC CTATGATCTC 
AACATGGGCG CGGGCTACGA ATACGACACG ACGCGGCTGC GCTTTTCCTA CAGCTCGATG 
ACGACGCCCG CGGAAGTCTA TGATTATGAC GTCGAGACGC GGGAGCGGAC ATTCCGCAAG 
CGGCAGGAAG TGCCCTCGGG CCACAACCCG GCCGACTACG AGACAAGGCG GATTTTCGCG 
CGCGCCTCGG ACGGCGAGAT GGTGCCGATT TCGCTCGTCC ACCGAAAGGG GCTGAGCCTC 
GACGGGAGCG CGCCCTGCCT GCTTTACGGC TATGGCTCTT ACGGGATCAG CATTCCGGCA 
TCGTTTTCCA CGACCTGCCT TTCGCTGGTC GATCGCGGCT TCGTCTATGC GATCGCGCAT 
ATTCGCGGCG GCAAGGAGAA GGGCTATCGC TGGTATACGG ACGGGAAGCT CAACAAGAAG 
CGCAACACCT TCACCGATTT CATCGCGGCG GGCGAGCACC TGGCGAAGGA AGGCTTCACG 
TCGCGCGGCA ACATCGTGGC GCATGGCGGC AGCGCGGGCG GGATGCTGAT GGGGGCGGTT 
TCCAACATGG CGCCCGATCT CTTCAAGGGC ATTCTGGCGG AAGTGCCGTT TGTCGATGTG 
CTGGCGACGA TCCTCGATGC GTCGCTGCCG CTGACGCCGC CGGAATGGAA CGAATGGGGC 
AACCCGATCG AGAGCAAGGA AGCCTACGAG TACATGGCTT CCTACAGCCC TTACGACAAT 
GTGAAGCCCC AAGCCTATCC GCATCTCTTC GCGCTTGGCG GGCTCACCGA TCCGCGCGTG 
ACCTATTGGG AGCCGGCGAA GTGGGTGGCG AAGCTGCGGG AGCTCAAGAC CGGCGATGCG 
GTGACGCTGC TTCACATCAA CATGGAGGCC GGACATGGCG GCGCTTCCGG CCGCTTCGAG 
CGGCTGAAGG AAGTGGCGCG GGTCTATGCC TTTGCGCTGG CGGTGACGGA ACGCGCGTGA

Protein sequence

MKLTPPAVAP LAPKRPQTDV HHGISRTDDY AWLRDENWRE VMRDPAVLDT DIRAYLDAEN 
AYTEAALKPV AELRETLFKE MKGRIKEDDS SVPSPDGAFA YYTRFVEGAQ HPLFCRRPRE 
AEAGEEILLD ANKEAEGEAY FKIGDVDHAP THKLIAWSAD RKGSEYFTVR LRDAATGKDL 
ADEVPDTSPG IAWDAAGTSF LYTQVDDEHR PLKVFRHVVG TAASEDTLVY EEEDEGFFVG 
VGKTQSGKWL VISSHDHQTS ECRLIPADAP ETAPLLVAPR EEAVEYDIEH DEPRERFLIL 
TNADGAEDFK IVEAPEAAPG RENWRDFVPH RPGTLVLHHV AYRGHHVRLE RRDGLPRIAV 
RRLADGAEHE IGFDEEAYDL NMGAGYEYDT TRLRFSYSSM TTPAEVYDYD VETRERTFRK 
RQEVPSGHNP ADYETRRIFA RASDGEMVPI SLVHRKGLSL DGSAPCLLYG YGSYGISIPA 
SFSTTCLSLV DRGFVYAIAH IRGGKEKGYR WYTDGKLNKK RNTFTDFIAA GEHLAKEGFT 
SRGNIVAHGG SAGGMLMGAV SNMAPDLFKG ILAEVPFVDV LATILDASLP LTPPEWNEWG 
NPIESKEAYE YMASYSPYDN VKPQAYPHLF ALGGLTDPRV TYWEPAKWVA KLRELKTGDA 
VTLLHINMEA GHGGASGRFE RLKEVARVYA FALAVTERA