Gene Dvul_2094 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dvul_2094
Symbol
ID	4662915
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris DP4
Kingdom	Bacteria
Replicon accession	NC_008751
Strand	+
Start bp	2433970
End bp	2435244
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	68%
IMG OID	639820337
Product	homoserine dehydrogenase
Protein accession	YP_967537
Protein GI	120603137
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0460] Homoserine dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.547464
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0709018
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACCGC TGGTCATCGG CATGGCCGGT TGCGGCACCG TGGGCAGCGG CCTCTTGCGC 
GTCCTCGAAG AGAACCGCCA GTGGATCGTC GAGCGCACGG GGCGTGCCGT CCAGGTGAAG 
CATGTGCTGG TACGCGACCT TTCGAAGCCG CGCGACCTGC CTGACGGGGC CAGCCTCACG 
GACGACCCCG CCGTCCTTAC GGACGACCCT GAAGTCGACG TGCTCGTCGA ACTCATGGGG 
GGCATCGAGA AGCCGCGCGA ACTCATCCGG CGCGCCATCG AGAACGGCAA GCATGTGGTC 
ACCGCCAACA AGGCCCTGCT GGCCGAAGAC GGCTTCGGCC TCTTCCGCCT TGCAGAGGAG 
AAGGGGGTGG GGCTGTACTA CGAGGCCAGC GTCGCCGGGG GCATACCCAT CGTGCAGACC 
CTGAAGGAGA GCCTCGCGGG CAACCGCATC ACCTCGCTGG TGGGCATCCT CAACGGCACG 
GCCAACCACA TCCTCTCCGA GATGACGAGT GCCGGGCTCG ACTTCGAGAC GGCCCTCGCG 
CAGGCGCAGG AACTCGGCTA CGCCGAGGCC GACCCCACGC TCGACATCGA CGGGCACGAC 
ACGGCCCACA AGCTGGTGCT GCTCATCCGT CTCGCCTACG GGCTCGAATA CCCCTACGCC 
GAGATGCCCG TGCAGGGCAT TCGCGGCATA GACCGCATGG ATATCGAGTT CGCTCGCGAG 
TTCGGCTTCC GCATCAAGCT GCTTGGGCAG GTGCGCGAGG TGGACGGCAG GCTCGAGGCG 
GGGGTATTCC CCACCCTCGT GCGCCACACC TACCTCATTG CCCGTGTGGG CGGCGCGTAC 
AACGCCATCC GCATCGAAGG CAACGCCGTC GGGCCGGTCT TCCTGCACGG GCAGGGCGCG 
GGCAGCCTGC CCACGGCCAG CAGCGTGCTT GCCGACCTTA TGGCGGTGGC ACGGTCGACC 
CCGCCGCACA ACACCGGCTT CCAGCGTCAG GTGCCGCCCA AGGCCAGCAT CCTGCCGCCC 
GATGACGCCG TGAGCGCGTA CTACGTTCGC GTCATGGTGC CCGACCACCC CGGTGTTCTT 
CGCGACCTTG CCGGGGCCAT GGCCGACCAC GGCATCAGCA TCGCACAGGC CATCCAGAAG 
GGGCAGGACA AGCGCGGCGT GCCGCTGGTG TTCATGACGC ATGAGGCAGG GGCACGCGCC 
ATCCGCGACG CCATCGAACA GATTCGCCAA GCTGGTCTGC TCACGGCCGA CCCGGTCTGC 
TACCGCGTGC TGTGA

Protein sequence

MKPLVIGMAG CGTVGSGLLR VLEENRQWIV ERTGRAVQVK HVLVRDLSKP RDLPDGASLT 
DDPAVLTDDP EVDVLVELMG GIEKPRELIR RAIENGKHVV TANKALLAED GFGLFRLAEE 
KGVGLYYEAS VAGGIPIVQT LKESLAGNRI TSLVGILNGT ANHILSEMTS AGLDFETALA 
QAQELGYAEA DPTLDIDGHD TAHKLVLLIR LAYGLEYPYA EMPVQGIRGI DRMDIEFARE 
FGFRIKLLGQ VREVDGRLEA GVFPTLVRHT YLIARVGGAY NAIRIEGNAV GPVFLHGQGA 
GSLPTASSVL ADLMAVARST PPHNTGFQRQ VPPKASILPP DDAVSAYYVR VMVPDHPGVL 
RDLAGAMADH GISIAQAIQK GQDKRGVPLV FMTHEAGARA IRDAIEQIRQ AGLLTADPVC 
YRVL