Gene DvMF_2968 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	DvMF_2968
Symbol
ID	7174910
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris str. 'Miyazaki F'
Kingdom	Bacteria
Replicon accession	NC_011769
Strand	+
Start bp	3743181
End bp	3744251
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	64%
IMG OID	643541501
Product	extracellular solute-binding protein family 1
Protein accession	YP_002437373
Protein GI	218888052
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0687] Spermidine/putrescine-binding periplasmic protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	78
Fosmid unclonability p-value	0.897922
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAAGA AGATGCTGTT GCTGCTGTCG ATGTTCACGG TGCTGCTGCT GCCCTGCCTG 
GGCAATGCCG CGCCCAAGGA ATTCCGCCTG CTGACCTGGA AGGGGTACGC CCCGGCGGAG 
CTGGTGGAAA AGTTCGAGAA GGAAACCGGC TACAAGGTGC AGGTGACCTA TTCGAACAAC 
GAGGAAATGA TCGCCAAGCT GCGCGCCACG CGCGGCGGCG GGTTCGACCT TGCCCAGCCC 
AGCCAGGACC GCATTTCTTC CGTGCAGGAA AGCTTCGGCC TGTACCAGCC CATCGACTTC 
GGCCGCATCG AGGCAGCCCG GTTCATTCCC TCCATGCTCG ACGCGGTGAA GAAGAACACC 
CTGGTCAAGG GCAAGTCGTA CGCCGTGCCG TTCTGCTGGG GCACCGACGG CCTGATCGTG 
AACCGCAAGT TCGCCCCCGA TGCCAAAAGC TTCGCCGACC TGCTGGACGC CAAGTACGCG 
GGCCGCGCCA GCTACCGCCT GAAGCGCCCC ACCCTCATCG CGCAGGCCTT CGGCATGGGC 
ATCGACCCCT TCAAGCTGTA CGCCGATGAA GCCGCCTACC AGAAGATGCT GGACCAGGTG 
GAAGGCAAGC TCATTGCCGC CAAGGGCGTG GTGAAGAACT ACTGGACCAA CGGCGACGCG 
CTGCTGGAAT CCATGCGTTC GGGCGAAGTG CACATCGCCC AGGCCTGGGA CAACGGCGGC 
TTCAAGCTGC ACGCGGAAAA CCCCGACATC GACTTTGTGG CGCCCACCAC CGGCGCGCTG 
GGCTGGATCG ACACCTTCGC CATCCCCGCC AAGGCCGACA ACGCGGACGC CGCGTACAAG 
TGGATCAACT TCATGATGCG GCCCGAAAAC GCGGCAGTGT TCACCAACGC CGAAGACACC 
CCCACCGCCG CCGTGGGCGT GGGCGAACGC CTGAAGCCCA CCTTCCGCGC AGACTTCGAA 
CGCTGCTACC CGCAGCAGGT CATCGACAAC ATCAAGTGGT ACCCGCCCGT GCCCGCCAAG 
CTCGAAGCCA TGGAAGGCAA GGCGCTGGAC CGGGTGAAGG CCGCCCAGTA G

Protein sequence

MTKKMLLLLS MFTVLLLPCL GNAAPKEFRL LTWKGYAPAE LVEKFEKETG YKVQVTYSNN 
EEMIAKLRAT RGGGFDLAQP SQDRISSVQE SFGLYQPIDF GRIEAARFIP SMLDAVKKNT 
LVKGKSYAVP FCWGTDGLIV NRKFAPDAKS FADLLDAKYA GRASYRLKRP TLIAQAFGMG 
IDPFKLYADE AAYQKMLDQV EGKLIAAKGV VKNYWTNGDA LLESMRSGEV HIAQAWDNGG 
FKLHAENPDI DFVAPTTGAL GWIDTFAIPA KADNADAAYK WINFMMRPEN AAVFTNAEDT 
PTAAVGVGER LKPTFRADFE RCYPQQVIDN IKWYPPVPAK LEAMEGKALD RVKAAQ