Gene Dvul_2090 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dvul_2090
Symbol
ID	4663204
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris DP4
Kingdom	Bacteria
Replicon accession	NC_008751
Strand	-
Start bp	2430358
End bp	2431422
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	68%
IMG OID	639820333
Product	chorismate synthase
Protein accession	YP_967533
Protein GI	120603133
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0082] Chorismate synthase
TIGRFAM ID	[TIGR00033] chorismate synthase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0281395
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0647066
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGGCA ACACACTGGG ACGTCTTTTC AGGCTGACGA CCTACGGCGA ATCGCACGGC 
GCAGGGCTTG GTGGCGTCAT CGACGGCTGC CCGGCAGGCA TTGCGCTGGA CGAGGCCGTC 
ATCCAGCGTG AACTCGACCT TCGCCGCCCC GGTGGCAACT CCGCCTCGAC CACCCGGCAG 
GAACCCGACA GGGTGCGTCT GCTTTCGGGC GTGTTCGAGG GGGTGACCAC CGGAACGCCC 
ATCGCCTTCC ACGTGGAGAA CGTCGACCAG CGTTCGCGCG ACTATGGCGA GATAGCCCGG 
TTGTACAGGC CGGGTCATGC CGATTTCACC TACGACGCCA AGTTCGGCGT ACGCGACTAT 
CGCGGCGGCG GTCGCGCCTC CGGGCGTGAG ACCCTCTCGC GCGTGGCGGG CGGTGCCATC 
GCGCAGGCGC TGCTGGCCCG CCATGGCATC GCGGTGCGGG CCTTCACCGT GGAACTTGGC 
GGCGTACCCG CCGACCTCGT GGACGTGGCG GGGGCGCAGC TACGTCCGTT CTTCTCGCCC 
GACCCCGATG TGGTGGAGGC GTGGGAGGAC ATGGTGCGCA CGGTGAAGGG CGAAGGCGAT 
ACCCTCGGCG GCATCGTGCA GGTCGAGGCC ACGGGAGTCC CCGCCGGTCT GGGCGAACCC 
GTGTTCGACA AGCTGGACGC CGTGCTTGCC TATGCGCTCA TGTCCGTAGG GGCGGTGAAG 
GGCGTCGAGG TCGGCGCCGG GTTCGAGGCC GCGCGGATGC ACGGCAGCGA CAACAACGAC 
CCCATCGTGC CCAGCGGTTT CTTCACCAAC CATGCGGGCG GCATTCTCGG CGGCATCTCC 
AACGGAGAGA CCATCGTCCT GCGCGCGGCG GTGAAGCCCA TCCCCTCCAT CGCGCAAGAG 
CAGATAACCA TCGACCGCGA CGGCAAGCCC TCGGCCCTGT TCATCGCCGG ACGGCACGAC 
ATTAGCGCGA TTCCGCGCAT CGTGCCTGTG CTCAAGGCCA TGACCGCACT CGTGCTGGCC 
GACATGCTGC TCATGCAGCG CCGCATGGCA ACGCCGCAGC CCTAG

Protein sequence

MSGNTLGRLF RLTTYGESHG AGLGGVIDGC PAGIALDEAV IQRELDLRRP GGNSASTTRQ 
EPDRVRLLSG VFEGVTTGTP IAFHVENVDQ RSRDYGEIAR LYRPGHADFT YDAKFGVRDY 
RGGGRASGRE TLSRVAGGAI AQALLARHGI AVRAFTVELG GVPADLVDVA GAQLRPFFSP 
DPDVVEAWED MVRTVKGEGD TLGGIVQVEA TGVPAGLGEP VFDKLDAVLA YALMSVGAVK 
GVEVGAGFEA ARMHGSDNND PIVPSGFFTN HAGGILGGIS NGETIVLRAA VKPIPSIAQE 
QITIDRDGKP SALFIAGRHD ISAIPRIVPV LKAMTALVLA DMLLMQRRMA TPQP