Gene Plav_2447 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plav_2447
Symbol
ID	5454845
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Parvibaculum lavamentivorans DS-1
Kingdom	Bacteria
Replicon accession	NC_009719
Strand	-
Start bp	2650349
End bp	2651515
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	65%
IMG OID	640878023
Product	peptidase M19 renal dipeptidase
Protein accession	YP_001413713
Protein GI	154252889
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2355] Zn-dependent dipeptidase, microsomal dipeptidase homolog
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	0.234226
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCGCA TTCTGATCGG TCTCGGGCTT GTCATTGCCA TACTGCTGGT GACGGGCCTC 
GCGCTCCTGC CCGGCATTCT TGAGGACCGG ATCAACCGGA TCGTCGAGCA CGAGCCCTAC 
GAGATCGCTC CCGATGCCGC AGCCCGCCAT GGGCAGCTCG CCGTCGTCGA TCTTCATGCC 
GATACGCTAC TCTGGGCGCG CGACCCCCTC GACCGCGCCA GCCGCGGCCA TGTCGATCTT 
CCCCGCCTCG TCGACGGCAA TGTAGCCCTG CAGGTTTTCT CCGTCGTGAC GAAGGTGCCG 
CGCGATCAAC GCTATGTCGG CACCAGTGGC GACAGTGACA TCATCACCCT TCTCGCCATG 
GTGCAGCGCT GGCCCGCGCG CACCTGGGAC AGCCTGCTGG AACGCGCGCT CTATCAGGCG 
GAAAAGCTGC ACCGCGCGGA AGAAGCCGCC CCCGGTGAAC TGAGGATCGT GCGAACGGCG 
GCCGATATCG ACGCGCTCCT GGCCGCGCGC GGCGGCGGTA GCCGCCCCGT CGGCGGCCTC 
CTAGCGACCG AAGGCTCGCA TGCCCTCGAA GGCAAGCTTG AAAACATCCA GCGCCTCTAT 
GATGCCGGCT ACCGGATGAT GGGCCTCACT CATTTTTTCG ACAATGAGCT CGGCGGCTCA 
CTGCACGGGA TTTCCGGCGG CGGCCTTACC GATTTCGGCC GCGAGGCGGT GCTCGAAATG 
GAACGCCTCA ACATCATCGT CGACCTCGCC CATGCCTCGC CCGCCGTCGT GGCGGACACG 
CTCGACATCG CAACGAGACC GACCGTCGTC TCCCATACCG GCATCAAGGG GGCCTGCGAC 
AGCCCCCGCA ATCTCGACGA CGCGCTGATG AAGCGCATAG CGGGTGCAGG CGGCTTGGTC 
GGCATCGGCT ACTGGGCGGG CGCCATCTGC GACCCCGCCC CCGCAGAGGT GGTGAAGTCG 
ATCCGCTATG CCATCGATTT TCTGGGCGTC GATCATGTCG CCCTCGGCTC CGATTATGAC 
GGCGCGGTAC CGGTCGCCTT CGACACATCG CAACTCGCCG TCCTGACCGA TGAGATGCAG 
AAGGCCGGTT TTACGGACGA GGAAATCGCC AAAATCATGG GCGGCAACGC CATTCGCTTC 
CTTCGTGAGC AACTTCCTGC CGATTAG

Protein sequence

MKRILIGLGL VIAILLVTGL ALLPGILEDR INRIVEHEPY EIAPDAAARH GQLAVVDLHA 
DTLLWARDPL DRASRGHVDL PRLVDGNVAL QVFSVVTKVP RDQRYVGTSG DSDIITLLAM 
VQRWPARTWD SLLERALYQA EKLHRAEEAA PGELRIVRTA ADIDALLAAR GGGSRPVGGL 
LATEGSHALE GKLENIQRLY DAGYRMMGLT HFFDNELGGS LHGISGGGLT DFGREAVLEM 
ERLNIIVDLA HASPAVVADT LDIATRPTVV SHTGIKGACD SPRNLDDALM KRIAGAGGLV 
GIGYWAGAIC DPAPAEVVKS IRYAIDFLGV DHVALGSDYD GAVPVAFDTS QLAVLTDEMQ 
KAGFTDEEIA KIMGGNAIRF LREQLPAD