Gene Plav_3591 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plav_3591
Symbol
ID	5454997
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Parvibaculum lavamentivorans DS-1
Kingdom	Bacteria
Replicon accession	NC_009719
Strand	+
Start bp	3836725
End bp	3838011
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	63%
IMG OID	640879175
Product	membrane dipeptidase
Protein accession	YP_001414846
Protein GI	154254022
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2355] Zn-dependent dipeptidase, microsomal dipeptidase homolog
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	76
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATGA ACGGACGGAG ATACGGCATT GCCGCCGCGC TCGCGGTTCT GTTGCTGGCC 
GCCCTCTGGA CGCTGCGCCC CGGTCTCACC CCCGCCGAAG CGGAGCCGAC GCCGGAAGAA 
ATCGCCGCCC GCATCCACAA GAGCGCCATC GTCATCGACA CCCATGTCGA TATTCCCTCC 
TTCTTCGGCT CCGCCTTGTA CGATCCCGGC CTCCGCAATG CCTATCCCGT CCAGGTCGAT 
CTGCCGCGCA TGCGCGAGGG CGGCCTCGAT GCGGCGTTCT TCATCGTCTA TGTCTCGCAG 
ACAGAGCGCG GTGCCGTCGG CTATGCGGAA GCTGCGTCCG AAGCATTGGC GAAATTCGCC 
GCCATCCGCC GCATGACGGA TATTCAGTAC AAGGACGAGA TCGGCCTTGC GCTCGACGCG 
GCGGATGTCC GGCGGCTTCA TGGCGAGGGC AAGCGCATCG CGCTCATCGG CATCGAAAAC 
GGCTACTCGG TGGCGAAAGA GCCCGCTCTT CTCGACTTCT ATTATGACCT CGGCGCGCGC 
TATTTCGGCC TCGTCCATAA TGGCCACAAC GATCTTTCCG ACAGCGCCCA GCCGCAGGAG 
AAATTCGCCG ACAAGCCGAA CGAGGAAGGT GGCGAGCATG ACGGGTTGAG CGAACTCGGC 
CGCGCCATGG TCGCGCGCGC AAACGATCTC GGCCTCATGG TCGATGTCTC CCACGCGTCT 
CGTGCCGCCG CGCTCGACGC AATCGCCGCC TCCCGCGCAC CCGTCATCGC ATCTCATTCC 
TCCGTCCATG CCCTTCGCCC CCATCCGCGC AACATGACGG ATGAGGAAAT GCTGGCGCTG 
AAGGAAAAAG GCGGCGTCAT CCAGATCGTC GCTTTCGACG AATATCTCCA TGATGTGCCC 
GAGGAGAAAA AGGCCGCCCG GCGCGATCTC GCCGTCTCGC TTGGCCTCAC AAGCCTCGAT 
GCCTTCTTCT CGGCGGATGC CGAAACGAAA TCGAAATTCG TCGCGGGCGT TGCCGAGCTC 
GACGCAAAAT GGCCGCGCGC CACCGTCGCG ACCCTTGCCG ATCATATCGA CTATGCGGTG 
AAGCTCATCG GCATCGACCA TGTCGGCATC GCGTCGGATT TTCAGGGCGG CGGCGGCATC 
GAGGGCTGGT CCCATGCGGG CGAAACGGCG AATGTCACCA TCGAACTGGT GCGGCGCGGC 
TATGACGAGG AGCAGATCGC AAAGCTCTGG GGCGGCAACC AGCTCCGCGT CATGGAAGCC 
GCCGAAAAGG CGCGGAAGGC CAAATAG

Protein sequence

MKMNGRRYGI AAALAVLLLA ALWTLRPGLT PAEAEPTPEE IAARIHKSAI VIDTHVDIPS 
FFGSALYDPG LRNAYPVQVD LPRMREGGLD AAFFIVYVSQ TERGAVGYAE AASEALAKFA 
AIRRMTDIQY KDEIGLALDA ADVRRLHGEG KRIALIGIEN GYSVAKEPAL LDFYYDLGAR 
YFGLVHNGHN DLSDSAQPQE KFADKPNEEG GEHDGLSELG RAMVARANDL GLMVDVSHAS 
RAAALDAIAA SRAPVIASHS SVHALRPHPR NMTDEEMLAL KEKGGVIQIV AFDEYLHDVP 
EEKKAARRDL AVSLGLTSLD AFFSADAETK SKFVAGVAEL DAKWPRATVA TLADHIDYAV 
KLIGIDHVGI ASDFQGGGGI EGWSHAGETA NVTIELVRRG YDEEQIAKLW GGNQLRVMEA 
AEKARKAK