Gene Dvul_2684 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dvul_2684
Symbol
ID	4662842
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris DP4
Kingdom	Bacteria
Replicon accession	NC_008751
Strand	-
Start bp	3125657
End bp	3126727
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	66%
IMG OID	639820931
Product	peptidase M24
Protein accession	YP_968123
Protein GI	120603723
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.045343
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0582018
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACAACA TCCGCTTCGA GGCCCGGCGC GAAAAGCTGC GGGCCGCCAT GCGCGAACGC 
GGGCTGGCGG CCCTGTTCGT CAGCCACGAC GCCAACCGCT ACTACCTTTC CGGTTTCGAA 
CTGCACGACC CGCAGACCAA CGAGAGCGCG GGCTATGTGC TCGTCACCGC CGACGGGCGC 
GACTGGATAT GCACCGACTC GCGGTATCTC GATGCCGCAC GGCGCATCTG GGACAACGAG 
CGCATCTTCA TCTACGGTGC CGATGCCCCC GCGCAGATGA ACACCCTCAT CCGCGACCAT 
GTACGCGGGA CGGTGGGCTT CGAAGCCCGT TCGGTGAGCC TCGAATTCTT CGAGAAGCTC 
TCGCCCGGCC TAGCCATGGA GCGCGTCGAC GGTCTCGTGG AAGCGCAGCG CATCATCAAG 
GAACCTGAAG AGATCGAGGT GATGGAGCGT TCATGCGCTC TCAACCATCG ACTCATGGAG 
TGGGTGCCCT CCATCCTGCG GCCCGGTCGC ACCGAGGCCG AAGTGGCGTG GGACATCGAA 
TCGTTCTTCC GTTCCAACGG CGCGTCGGAA CTCTCGTTCG CCAGCATCGT GGCGGTGGGC 
CCCAACGGCG CGCTGCCGCA CCACCGTGGC GGGCGCGACG TCATCACCGA CAACTGTTCG 
GTGCTGGTGG ATGTGGGCGC ACGTCTCGAC GAATACTGTT CCGACCAGAC CCGCACCTTC 
TGGGTGGGTG ACAAGCCCGC CGACCATTTC GTGCGCGCAC TGGAACAGAC GCAGACGGCG 
CAGGCCAAGG CCATCGCCGC CATGCACCCC GGCATGCGCG CCTGCGACGC CTACAAGGTG 
GCGCGTGACC ACTTCGAGAG CGTCGGCGTG GCGGCGCACT TCACCCACGC ACTGGGGCAC 
GGCATCGGGC TCGAGACGCA TGAACCGCCA AGCCTCAACC CCCGCAACGA GATGGTGCTC 
AAGCCCGGCA TGGTGGTGAC CGTTGAGCCG GGGCTGTACT ATCCCGAGTG GGGCGGCATC 
CGCTGGGAGT ACATGGTGCT GGTGACCGAA GACGGCGTCC GCGCCCTGTA G

Protein sequence

MDNIRFEARR EKLRAAMRER GLAALFVSHD ANRYYLSGFE LHDPQTNESA GYVLVTADGR 
DWICTDSRYL DAARRIWDNE RIFIYGADAP AQMNTLIRDH VRGTVGFEAR SVSLEFFEKL 
SPGLAMERVD GLVEAQRIIK EPEEIEVMER SCALNHRLME WVPSILRPGR TEAEVAWDIE 
SFFRSNGASE LSFASIVAVG PNGALPHHRG GRDVITDNCS VLVDVGARLD EYCSDQTRTF 
WVGDKPADHF VRALEQTQTA QAKAIAAMHP GMRACDAYKV ARDHFESVGV AAHFTHALGH 
GIGLETHEPP SLNPRNEMVL KPGMVVTVEP GLYYPEWGGI RWEYMVLVTE DGVRAL