Gene Dvul_1989 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dvul_1989
Symbol
ID	4663328
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris DP4
Kingdom	Bacteria
Replicon accession	NC_008751
Strand	+
Start bp	2318945
End bp	2320168
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	63%
IMG OID	639820230
Product	peptidase M24
Protein accession	YP_967432
Protein GI	120603032
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.758645
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.208351
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCACTG CCGCAGAACG CATTCCCGAC GATGAAGTCC GCCGCCGCCA CAGCCGCTGC 
CGTGCGGCCC TCGCAGACGT CGCCCCCGAG GCCTCCGGTC TGCTGGTCTT TGCCAGACTC 
TCCATCTACT ACCTCACCGG TTCGCTCGGT AACGGCGTGC TGTGGCTACC CCGCGAAGGC 
GAAGCCATGC TCTTCGTCCG CAAGGGCATT GAACGCGTTC TGCTTGAAAG CCCCATTGAA 
CTTGTGCACC CCTTCCGTTC CTACGGCGAC ATCGTCGAAC TCGCACGCGA AGCAGGTTCC 
CCATTGGGCG GGGTGGTTGC TGCCGAGATG GGAGGACTGC CATGGTCTCT CGCCAACCTG 
CTGCAACAGC GCCTTCAGGG CGTTTCTTTC GTACCCGGCG ACATGGCGGT AACCCTCGCG 
CGGGCCGTCA AGTCACCATG GGAACTGAAC AAGATGCGCC TTGCCGGGGC AAGGCATCAC 
GAAAGCCTGC ACGAAGCCCT TCCGCAGCGC ATACGCCCCG GCATGACCGA ACGAGAGGTC 
TCGCACCTCG CGTGGCAGGT CTTCTTCGAG CGCGGGCATT CGGGCATGAT GCGCATGTCC 
GCCAATGGTG AGGAGATATT CCTCGGCCAT GTGGCCGCCG GAGAGAACGG GAACTACCCC 
AGCCACTTCA ACGGCCCGCT GGGGCTCAAA GGCGAACATC CCGCCGTCCC CTACATGGGC 
TATGCGGGGT CTGTATGGCG CAGGGGAACG CCGTTGGCCG TGGACATCGG CTTCACCCTT 
GAAGGCTATC ATACCGACAA GACGCAAGTG TACTGGGCGG GTCCGCGTGC CTCCATCCCT 
GACGCCGTGC TGCGCGCCCA CGAGACGTGC ATGGAAGTGC AGGCCCGCGC AGCCGCAGCC 
CTGCGCCCCG GCGCCATCCC CTCCGCCATC TATCAGGACG CCCTGCAACT CGTCGGGGAG 
TACGGACTCT CTGAAGGATT CATGGGAATT GGAAGCAACA AGGTACCGTT CCTCGGGCAC 
GGCATCGGCC TTGCCGTGGA TGAACACCCG GTACTGGCCC GGCGTTTCGA TGCGCCTCTC 
CAGACCGGCA TGGTCATCGC CATCGAACCC AAGATGGGCA TCCCCGGAGT GGGGATGGTG 
GGAGTGGAGA ACACCTTTGA AGTGACGGAA GACGGTGGCC GCTGCCTCAC GGGTGACGAG 
TACGACATCG TCTGCATCGA ATGA

Protein sequence

MFTAAERIPD DEVRRRHSRC RAALADVAPE ASGLLVFARL SIYYLTGSLG NGVLWLPREG 
EAMLFVRKGI ERVLLESPIE LVHPFRSYGD IVELAREAGS PLGGVVAAEM GGLPWSLANL 
LQQRLQGVSF VPGDMAVTLA RAVKSPWELN KMRLAGARHH ESLHEALPQR IRPGMTEREV 
SHLAWQVFFE RGHSGMMRMS ANGEEIFLGH VAAGENGNYP SHFNGPLGLK GEHPAVPYMG 
YAGSVWRRGT PLAVDIGFTL EGYHTDKTQV YWAGPRASIP DAVLRAHETC MEVQARAAAA 
LRPGAIPSAI YQDALQLVGE YGLSEGFMGI GSNKVPFLGH GIGLAVDEHP VLARRFDAPL 
QTGMVIAIEP KMGIPGVGMV GVENTFEVTE DGGRCLTGDE YDIVCIE