Gene Dvul_0844 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dvul_0844
Symbol
ID	4663991
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris DP4
Kingdom	Bacteria
Replicon accession	NC_008751
Strand	-
Start bp	1035441
End bp	1036562
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	66%
IMG OID	639819066
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_966292
Protein GI	120601892
COG category	[R] General function prediction only
COG ID	[COG4174] ABC-type uncharacterized transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.367141
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.038262
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGCCC GACAGTCATC CCACGGCGGG GCATGGGGCT ACATGCTGCG CCGCCTGCTG 
CTGGTGCTGC CCACGCTTCT CGGCATCGTC ACGATCAACT TCTTCGTGGT GCAACTGGCC 
CCCGGCGGCC CGGTGGAACA GTACATCGCC CGTCTCGAAG GTGATGGCGC CGCCTACATG 
GAACGCATCG GCGCAGGTGA TGGCGGCGAC ATGCAGCCCG CAGCCGACGA CGGGACAGCC 
GCCTACAAGG GGGCGGCGGG ACTCAGCCCG CAGGCTGTGG AGGCCATCCG CCGACAATAC 
GGCTTCGACC GCCCCATCCT CGAACGCTAC GTCACCATGC TGGGCGACTT CGCCCTGTTC 
AGGTTCGGCG ACAGTCTCTT CAAGGGGCGC AGCGTCATCG ACCTCGTAGG TGACGCCATG 
CCCGTATCGC TGTCGCTGGG ACTCTGGAGC ACCCTCGTCA TCTATGCCGT ATCCATCCCG 
CTGGGCATGG CGCGCGCGCT GCGCCGCGGC AGCCGATTCG ACACCATGAG CGGCATCGCC 
GTCATCGCGG CACACGCCAT CCCCGCCTTT CTGCTGGCGG TGCTGCTCAT CGTGCTCTTC 
GCCGGGGGCA GCTACCTGCA ATGGTTCCCG CTGCGGGGGC TGGTGTCGCC GGGGCACGAC 
GCGCTGCCTT TCGGGGCACG GGTGCTCGAC TATGCGCACC ACATGGTACT GCCCGTGACC 
GCCATGGTCG TGGGCGGTTT CGCGGGGCTG ACCAGCCTGA CGCGCAACGC CTTTCTCGAC 
GAACTCGGCA AAGCCTATGT GGAGACGGCC CTCGCCAAGG GCCTCACGCG CAAGGCCGTG 
TTGTGGCGGC ACGTCTTCCG CAACGCCATG CTGCTGGTCA TCAGCGGGCT GCCCGGTGCC 
TTCGTGCGGG TGTTCTTCAC CGGTTCGCTG CTCATCGAGA CCATCTTCTC GCTCAACGGC 
CTCGGACTCA TGGGGTTCGA AGCCGCCATG CAGCGCGACT ACCCTGTCAT GTTCGCCTCT 
CTCTATGTCT TCACGCTCAT CGGTCTGACG GCATCCCTTG CCGGAGACAT GCTCTGCATG 
GCCGTTGACC CGCGCATCGA CTTCGAAAGG AGGGCGGCAT GA

Protein sequence

MRARQSSHGG AWGYMLRRLL LVLPTLLGIV TINFFVVQLA PGGPVEQYIA RLEGDGAAYM 
ERIGAGDGGD MQPAADDGTA AYKGAAGLSP QAVEAIRRQY GFDRPILERY VTMLGDFALF 
RFGDSLFKGR SVIDLVGDAM PVSLSLGLWS TLVIYAVSIP LGMARALRRG SRFDTMSGIA 
VIAAHAIPAF LLAVLLIVLF AGGSYLQWFP LRGLVSPGHD ALPFGARVLD YAHHMVLPVT 
AMVVGGFAGL TSLTRNAFLD ELGKAYVETA LAKGLTRKAV LWRHVFRNAM LLVISGLPGA 
FVRVFFTGSL LIETIFSLNG LGLMGFEAAM QRDYPVMFAS LYVFTLIGLT ASLAGDMLCM 
AVDPRIDFER RAA