Gene DvMF_1929 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	DvMF_1929
Symbol
ID	7173847
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris str. 'Miyazaki F'
Kingdom	Bacteria
Replicon accession	NC_011769
Strand	+
Start bp	2379495
End bp	2380565
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	67%
IMG OID	643540445
Product	peptidase M24
Protein accession	YP_002436340
Protein GI	218887019
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	94
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGCAC AACGCTACGA GGCGCGGCGC GAAACCCTGC GCGCCGCCAT GCGCGAAAAA 
GGCCTGTCCG CCCTGCTGGT AAGCCACGCG GCCAACCGGT TCTACCTTTC CGGCTTCGAA 
CTGCACGACG TGCAGCTGAA CGAGAGCGCC GGGTACCTCA TCGTCACCGC CGACGGCAAC 
GACTGGCTGT GCACCGACCC CCGCTACCTC GACGCGGCCC GCCGCCTGTG GCCCGAAGAG 
CGCGTGTTCA TCTATTCCGG CGATGCGCCG GGCCAGATCA ACGGCCTGCT CAAGGACAAG 
GTGCGCGGCA CCGTGGGCTT CGAGGCGCGT GCCGTGACCC TGGACTTCTT CGACAAGGTC 
TCGCCCGGCC TGACCATGGA ACGGGCCGAC GGCATGGTCG AGGAAATGCG GGTGATCAAG 
GAACCCGAGG AAATCGAGCT GATGCGCCGT TCCGCCGCGC TGAACCACCA GCTCATGGAA 
TGGGTGCCCA GCATCCTCGT GCCCGGTCGC ACCGAAGCGG AAATCGCCTG GGACATCGAA 
AAGTTCTTCC GCGAACATGG CGCCAGCGAA CTGGCCTTCT CCAGCATCGT GGGCGTTGGC 
CCCAACGCCG CCCTGCCCCA CTACGCCCCC GGCGACGTGC CCCTGACCGA AAACTGCCCG 
GTGCTGGTGG ACGTGGGCGC GCGGCTGGAC CTGTACAACT CGGACCAGAC CCGCACCTTC 
TGGGTGGGCG ACAAGCCCGC CGACCACTTC ACCCGCGCGC TGGAACAGAC CAAGGCCGCC 
CAGGCGGAGG CCATAAGGAT CATGCGCCCC GGCCTGCCAG TGGCCGACGC CTACCGCGCC 
GCGCGCGCCC ACTTCGAGGC GCAGGGCGTG GCCGCCCACT TCACCCACGC GCTGGGGCAC 
GGCATAGGCC TCGAAACCCA CGAGCCGCCC AGCCTGAACC CGCGCAACGA AATGATCCTG 
AAGCCCGGCA TGATCGTGAC CGTGGAACCC GGCCTGTACT ACCCCGAATG GGGCGGCATC 
CGCTGGGAAT ACATGGTGCT GGTCACCGGC GACGGGGTGG AGATTCTCTA G

Protein sequence

MNAQRYEARR ETLRAAMREK GLSALLVSHA ANRFYLSGFE LHDVQLNESA GYLIVTADGN 
DWLCTDPRYL DAARRLWPEE RVFIYSGDAP GQINGLLKDK VRGTVGFEAR AVTLDFFDKV 
SPGLTMERAD GMVEEMRVIK EPEEIELMRR SAALNHQLME WVPSILVPGR TEAEIAWDIE 
KFFREHGASE LAFSSIVGVG PNAALPHYAP GDVPLTENCP VLVDVGARLD LYNSDQTRTF 
WVGDKPADHF TRALEQTKAA QAEAIRIMRP GLPVADAYRA ARAHFEAQGV AAHFTHALGH 
GIGLETHEPP SLNPRNEMIL KPGMIVTVEP GLYYPEWGGI RWEYMVLVTG DGVEIL