Gene Dvul_0224 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dvul_0224
Symbol
ID	4662352
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris DP4
Kingdom	Bacteria
Replicon accession	NC_008751
Strand	-
Start bp	272431
End bp	273726
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	64%
IMG OID	639818420
Product	extracellular solute-binding protein
Protein accession	YP_965675
Protein GI	120601275
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCCTAT TCCGCAAAAC CTGCGCACTG GTGGCGGCTT CGCTGCTGTC GCTGACCCTG 
ATGGCGGGCA CCGCGCTCGC CGAAAAGGTC AATCTCACCT TCTACTTCCC GGTCTCCGTC 
GGCGGCCCCA TCACCAAGAT TGTCGAGGGC ATGACAGAGC AGTTCATGAA GGAACACCCC 
GACATCAACA TCACCCCCGT CTACGCAGGC ATCTACCGCG AGACGCTCAC CAAGGCGCTC 
ACGGCCCTGC GTGGCGGTGA ACCGCCCCAT GTTGCCGTGC TGCTCTCCAC CGACATGTAC 
ACCCTCATCG ACGAGGATGC CATCGTCCCC TACGACAGCA TCATGAAGCC CGAAGATATG 
GCCTTCACCA AGGCGTTCTT CCCCGGCTTC ATGAGCAACA GCCAGACCGG CGGCAAGACG 
TGGGGCATTC CCTTCCAGCG CTCGACCATC GTCATGTACT GGAACAAGGA GGCCTTCAAG 
GCTGCGGGCC TCGACCCTGA CAAGGCCCCT GCCAACTGGC AGGAACTGGT CGCCATGGGC 
AAGAAGCTCA CCGTCAAGGA CGAAAGCGGC AAGGTCACCC AGTGGGGCGT CGCCATCCCG 
TCCACCGGCT ATGCCTACTG GATGCTGCAG GCCCTCGCCA TCCAGAACGG CGTGGAACTC 
ATGAACGCCG AAGGCACCAA GACCTACTTC GACGACCCCA AGGCCATCGA AGCCCTCACC 
TTCCTCGTCG ACCTCGCCGG CAAGCACGGC GTGTCGCCCT CCGGCACCAT CGACTGGGCC 
ACCACCCCGC GTGACTTCTT CGAGCGCAAG ACCGCCATCA TGTGGACCAC CACCGGCAAC 
CTGACCAACG TCCGCAAGAA CGCGCAATTC CCCTTCGGTG TGGGCATGCT GCCCGCCAAC 
ACCCGCCCCG GTTCGCCCAC GGGCGGCGGC AACTTCTACA TCTTCAAGAA GAGCACCCCC 
GCCGAACGTC AGGCCGCCGT CACCTTCGTG AAGTGGATGA CCAGCGCCGA ACGCGCAGCC 
CAGTGGGGTA TCGACACCGG CTATGTGGCG GTGCGCCCCG ATGCATGGGA GACCAAGGCC 
ATGAAGGACT ACGTGGCCTC CTTCCCCTAC GCCGCCATCG CCCGCGACCA GCTGGCCCAC 
GGCGTGGCCG AGCTCTCCAC CCACGACAAC CAGCGCGTGA CCAAGGCGCT TGACGACGCC 
ATTCAGGCCG CCGTCACCGG TTCCAAGACA CCTGCCGAAG CACTCAAGGC AGCCCAGAAG 
GAAGCCGAGC GCATCCTGCG CCGTTACGCG AAGTAG

Protein sequence

MALFRKTCAL VAASLLSLTL MAGTALAEKV NLTFYFPVSV GGPITKIVEG MTEQFMKEHP 
DINITPVYAG IYRETLTKAL TALRGGEPPH VAVLLSTDMY TLIDEDAIVP YDSIMKPEDM 
AFTKAFFPGF MSNSQTGGKT WGIPFQRSTI VMYWNKEAFK AAGLDPDKAP ANWQELVAMG 
KKLTVKDESG KVTQWGVAIP STGYAYWMLQ ALAIQNGVEL MNAEGTKTYF DDPKAIEALT 
FLVDLAGKHG VSPSGTIDWA TTPRDFFERK TAIMWTTTGN LTNVRKNAQF PFGVGMLPAN 
TRPGSPTGGG NFYIFKKSTP AERQAAVTFV KWMTSAERAA QWGIDTGYVA VRPDAWETKA 
MKDYVASFPY AAIARDQLAH GVAELSTHDN QRVTKALDDA IQAAVTGSKT PAEALKAAQK 
EAERILRRYA K