Gene Dvul_2031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dvul_2031
Symbol
ID	4662479
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris DP4
Kingdom	Bacteria
Replicon accession	NC_008751
Strand	-
Start bp	2365033
End bp	2366163
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	65%
IMG OID	639820274
Product	alanine racemase
Protein accession	YP_967474
Protein GI	120603074
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0787] Alanine racemase
TIGRFAM ID	[TIGR00492] alanine racemase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCATAT CCTACAACAA GGCGAGTGTT GTCGTCAGTC TCCAATCCAT TATCGCCAAC 
TATCGCCGGA TTCGTACGGT GGCACAGCGG CCCATGCCCG TCATCAAATC CGATGCGTAC 
GGCCACGGCC TTGAAGCTGT GGGCATGGCC CTTGAGGCCG AAGGTGCACG TGAATGCGCC 
GTCGGTACGG TGGGGGAGGG GGCGAAGCTG CGCAAGGCCG GTTTCGGGGC GGATATCGTC 
GCCCTGCTTG GGGCCCTCGA CAGAGAGGAT GCCCAGTTGG CGGCCTCTTC CGGCATCATC 
CCCACCGTCC TTGACATCGC CGGGCTTGAA CGCCTTGCCG CGCAGGGTAC CACCGAAAGG 
CCGGTGCGCG TGGCGCTCAA GTTCGATACG GGCATGGCCC GCCTCGGCTT CACGGAACAT 
GATGTGTCTG CCCTTTGCGA GCGTCTGCGC ACCCTGCCTT CGGTGCGGCC CGTCATGGCG 
GTATCGCATC TCGCCGTTGC CGACGACCCC ACCCAGTCGG CCTTCACGAT GGCGCAAGGG 
GCCGCATTCG CGCGTATCAT GGCGGGGCTT CGAAGCAACT TCCCCGATAT CATGGGGTCG 
CTGTCAAACT CCGCAGCCAC GCTGGCGCAC CCGCAACTGC ACTGGGACGT GCAGCGTCCC 
GGCATCGCCC TCTATGGTTC GAATCCCCTT CGCGGGACGG CCCTTGCACG GCATGGCGAA 
GGGCTGTTGC CCGCCATGTC CGTCTCCGTG CCGGTGTTGC AGGTCCATCC GCTGCCCGCG 
GGGCGTAGTA TCAGCTACGG GCGGACGTAC ACCGCCACCA AAGATGCGAC CGTGGCCATC 
ATAGCCGCCG GATACGCCGA CAACTACAGC CGCGCCCTGT CAGGGCGTGG TGTGGCTGTA 
GCTGGCGGGC GGCGTGTGCC TGTTCTTGGT CGCGTGTGCA TGCAGACCAC GGCCATCGAC 
GTCACCGACG TGCCCGGCAT CGCCACGGGA GACCGTGTAT GGCTGCTTGG TGGCCCCGGC 
CCCGCCACGG TCTCGGCTGA TGAACTGGCC GACCTGTGGG GGACGATATC CTATGAAGTG 
CTGTGTCTGC TTGGCATGAA CCCGCGCAGG CATGACGACT CTGTGGAGTA G

Protein sequence

MPISYNKASV VVSLQSIIAN YRRIRTVAQR PMPVIKSDAY GHGLEAVGMA LEAEGARECA 
VGTVGEGAKL RKAGFGADIV ALLGALDRED AQLAASSGII PTVLDIAGLE RLAAQGTTER 
PVRVALKFDT GMARLGFTEH DVSALCERLR TLPSVRPVMA VSHLAVADDP TQSAFTMAQG 
AAFARIMAGL RSNFPDIMGS LSNSAATLAH PQLHWDVQRP GIALYGSNPL RGTALARHGE 
GLLPAMSVSV PVLQVHPLPA GRSISYGRTY TATKDATVAI IAAGYADNYS RALSGRGVAV 
AGGRRVPVLG RVCMQTTAID VTDVPGIATG DRVWLLGGPG PATVSADELA DLWGTISYEV 
LCLLGMNPRR HDDSVE