Gene Dvul_1685 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dvul_1685
Symbol
ID	4663670
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris DP4
Kingdom	Bacteria
Replicon accession	NC_008751
Strand	+
Start bp	1998797
End bp	2000347
Gene Length	1551 bp
Protein Length	516 aa
Translation table	11
GC content	61%
IMG OID	639819924
Product	hypothetical protein
Protein accession	YP_967129
Protein GI	120602729
COG category	[S] Function unknown
COG ID	[COG2898] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAGAC ATCTCCGCTC TCTCGGGTCG TTCGTCGTTC TCTGCATTTT CGCCGGTGCC 
GCATGGCTGC TCTACCACGA AGTTCGCAAA TACCATCTTG CCGACATCCG ACAAAGCATT 
GAACTCATTC CCGACCTGAG GCTTCTTGCC TCTTTCGGGC TCATGATCGT CAACTACCTC 
ATCCTCGTGG GCTATGACGC CCTTGCGCTC AAGGCCATAG GGAGACCGCT GCCTCTCGGG 
AAGACGGCGC TGGTATCGTT CGTTGGCTGC GCATGCAGCT ACAATTTCGG CGCACTGCTG 
GGCGGAAGTT CCGTCCGCTA CCGCTTCTAT TCGGCGTGGG GTTTCACCAT CCCCGATGTC 
GTGCGGCTTG TGCTCATGCT GGCGGTCACC TTCTGGGTGG GCGCCCTCGG GCTGGCGGGG 
CTATCATTCG TCATCGAACC ATTGCCACTC CCTCCGGGGC TTGGTCTGCC CATAGATGAC 
GTGCGCCCTC TCGGTTTTGC CCTGCTTGCT GCGACGACAG GCTATCTTCT TCTGACATTC 
TTCGTTCGCA AGCCCCTGCA TTTTTTTGGT AGGGAGTTCG CGCTCCCCTG TCCGAAAATC 
GCTTTCGCGC AGACACTGAC GGCATGCGCC GACCTTGTGG CCGCCGCGGG CTGCCTCTAC 
ATGCTGATGC CGAGCGACCT TGGACTCGAC TTTCTCACGT TTCTCGCCGT GTATCTGCTG 
GCCACAGTCG TGGTGGTCCT CACCCACGTT CCCGGCGGGG CGGGAGTCTT CGAACTTGTC 
ATCCTCAGCC TTTCACAGAC AACGCACCCG CAGGCCGTCA TCGCGGCACT TCTGGCGTTC 
CGGGTCATCT ACTACCTGCT GCCGCTCCTG TTCGCGGCGC TTCTGCTGGC GGGCTACGAA 
GTGCAGGTAC GACGCCATCA GGCTGAAAAG GCATTTCGTG ACGCAGGACG CTGGATGTGG 
GTACTCTCCC ATATCCTGCT TTCGTATGTG ACATTCGCGG CAGGTGTCAT CCTGCTGCTT 
TCCGGCAGCA TTCCCCCGAA CAAGCTGCTC ATCGCCCAGT CGCCCCTTGT CGTTCCGCCT 
GCAGTGCAGG AGGCCGCCCA CATTCTTGGA AGTATGGCCG GGGCCGGACT ATTGCTGCTC 
TCACGCGGTA TCGAGCGCCG CCTTGCGTCG GTATGGAAGG TCGTCGTCAC CCTGCTGCTT 
ACGGGCATGG TGTGCGCCCT GCTCAAGGGC TTCGACTGGC ACGAGGCTGT ACTCCTGTCG 
TTTGCCCTTG CAGGACTTCT GGGCTCACGC CGTCGGTTCT ACCGGAAGTC TTCGCTCATC 
CGGGAAGAAT ATCCGCTTCG CTGGTTCTTC GCCTCCGCCG CCGTCATCGG TTGCGCTGGC 
GCGGTCGCAC TCTTTGCCTT CGGCGATGCC GGTACAGGCA TGAGGGGCCT ATGGGAAGCC 
ATCAGTGACG ATGCCGGTGC TGCGCGTGCG GTGCGTGGCA TCGCCGCCGC CTGTGCCGTC 
ATGGTTGCCT TCACCCTGCG CCGACTGTTG CTGCCGCTGC ATAAGCAGTA G

Protein sequence

MNRHLRSLGS FVVLCIFAGA AWLLYHEVRK YHLADIRQSI ELIPDLRLLA SFGLMIVNYL 
ILVGYDALAL KAIGRPLPLG KTALVSFVGC ACSYNFGALL GGSSVRYRFY SAWGFTIPDV 
VRLVLMLAVT FWVGALGLAG LSFVIEPLPL PPGLGLPIDD VRPLGFALLA ATTGYLLLTF 
FVRKPLHFFG REFALPCPKI AFAQTLTACA DLVAAAGCLY MLMPSDLGLD FLTFLAVYLL 
ATVVVVLTHV PGGAGVFELV ILSLSQTTHP QAVIAALLAF RVIYYLLPLL FAALLLAGYE 
VQVRRHQAEK AFRDAGRWMW VLSHILLSYV TFAAGVILLL SGSIPPNKLL IAQSPLVVPP 
AVQEAAHILG SMAGAGLLLL SRGIERRLAS VWKVVVTLLL TGMVCALLKG FDWHEAVLLS 
FALAGLLGSR RRFYRKSSLI REEYPLRWFF ASAAVIGCAG AVALFAFGDA GTGMRGLWEA 
ISDDAGAARA VRGIAAACAV MVAFTLRRLL LPLHKQ