Gene Dvul_2254 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dvul_2254
Symbol
ID	4663769
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris DP4
Kingdom	Bacteria
Replicon accession	NC_008751
Strand	-
Start bp	2621732
End bp	2622862
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	63%
IMG OID	639820499
Product	extracellular ligand-binding receptor
Protein accession	YP_967697
Protein GI	120603297
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGGTG TCGTCAGGTT GCTGGCGGTC TGCATGGTCA CGTCGCTGCT CATGGCTGCG 
ACGGCGTTCG CCGCCGGGCC GGTGCGTGTG GGGCTCATGT GTCCGCTGAC CGGCAAATGG 
GCCAGTGAAG GGCAGGACAT GCGCAACATT GTCGAACTGC TGGCTGAAGA GGTGAACAAG 
GCCGGGGGCA TCAACGGCAA CAAGGTCGAA CTGATCGTCG AGGACGACGG TGGCGACCCG 
CGCACTGCAG CACTCGCCGC GCAGAAGCTT TCCACCTCCG GTGTTACCGC CGTCATCGGC 
ACCTATGGCT CGGCTGTGAC CGAAGCCTCC CAGAACATCT ACGACGAGGC GGGCATCGCC 
CAGATAGCCA CCGGGTCGAC CAACGTGCGC CTCACCGAAA AGGGCCTCAA GCTCTTCCTG 
CGCACCTGCC CGCGTGACGA CGAACAGGGT CGCGTCGCCG CCAAGGTCAT CAAGAGCAAG 
GGCTACAAGG CCGTTGCCCT GCTGCATGAC AACTCGTCCT ACGCCAAGGG CCTCGCCGAC 
GAGACCAAGG CACTGCTCGA CAAGGACGGC ACCAAGATCG TGTTCTACGA CGCCCTCACC 
CCCGGCGAGC GCGACTACAC CGCCATCCTG ACCAAGCTCA AGGCCGCCAA CCCCGACATC 
ATCTTCTTCA CGGGCTACTA CCCCGAAGTG GGCATGCTGC TGCGCCAGAA GATGGAGATG 
AAGTGGAACG TGCCCATGAT GGGCGGAGAC GCCGCCAACA ACCTCGACCT GGTCAAGATT 
GCGGGCAAGC CCGCCGCGAA GGGCTACTTC TTCCTCAGCC CGCCCGTGCC GCAGGACTTC 
GACACCGCCG AAGCCAAGGC CTTCCTCGCC GCCTACAAGG CCAAGCACAA CGCCCTGCCC 
AACTCGGTGT GGTCTGTGCT TGCCGGTGAC GCCTTCAAGG TCATCGTCGA AGCCGTGCAG 
AAGGGTGGCA AGGCCGACGG TGCCTCCATC GCCACGTACC TGAAGACCCA GCTCAAGAAC 
TACCCCGGTC TTTCGGGGCA GATATCCTTC AACGAAAAGG GCGACCGCGT AGGCGACCTG 
TACCGCGTGT ACGACGTCAA CGCCGAAGGC GAATTCGTCC TGCAGCGTTA G

Protein sequence

MKGVVRLLAV CMVTSLLMAA TAFAAGPVRV GLMCPLTGKW ASEGQDMRNI VELLAEEVNK 
AGGINGNKVE LIVEDDGGDP RTAALAAQKL STSGVTAVIG TYGSAVTEAS QNIYDEAGIA 
QIATGSTNVR LTEKGLKLFL RTCPRDDEQG RVAAKVIKSK GYKAVALLHD NSSYAKGLAD 
ETKALLDKDG TKIVFYDALT PGERDYTAIL TKLKAANPDI IFFTGYYPEV GMLLRQKMEM 
KWNVPMMGGD AANNLDLVKI AGKPAAKGYF FLSPPVPQDF DTAEAKAFLA AYKAKHNALP 
NSVWSVLAGD AFKVIVEAVQ KGGKADGASI ATYLKTQLKN YPGLSGQISF NEKGDRVGDL 
YRVYDVNAEG EFVLQR