Gene Dvul_1975 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dvul_1975
Symbol
ID	4663419
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris DP4
Kingdom	Bacteria
Replicon accession	NC_008751
Strand	-
Start bp	2294274
End bp	2295494
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	61%
IMG OID	639820216
Product	hypothetical protein
Protein accession	YP_967418
Protein GI	120603018
COG category	[S] Function unknown
COG ID	[COG3672] Predicted periplasmic protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.495543
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAAGG CGCGGGAGAG ACAGTGGCAG GAGGGGCCGT ATGCGCGGTT CTCCTTTTGT 
GCGGCGGTGG TCGTACTGCT CTGTCTCTTC GTGCCCACGT TCTTTCTGGG GCTTCCGGGA 
GATACCGAAG CTGGGGGTGC CAGTCCGAAA GCAGCCCCCT ATGAGCCGCG CGATGGCGAG 
GCTGTAACGC GGGGCGAGTC TGAACAGCGA GCGTCTTCCC GTCATGTCAT CGGACAGGCC 
CCAGACCCGC AGCAGGCTCC AGATGCACGC GTCATTGCAT CGGAAGCGCC TGCTTCACCA 
GCCGATACAG ATGTCCGGGG GGAGCGGAAG GTCCCGGGCA CCACTGGGGA GGACGCTTCC 
AGCAACCGGC CTGAAGTCTC ACCGGTGCTT GAGGTCGCAG CTGACGGCCC GCTGCGTCAT 
GTACGCCCGG AGGACATGCG AGGCGGTGCG CAGCAGTCCC CGGTGCAGCC TTCGGGACAG 
CGGGGGCACC GGGCAGGTGC GACTTCGGAT GGGACACCGG ATGGTGGGGA ACATTCCGGG 
AATGCCGCGA CTGCCGAAGA TGGAGAAGGG CAGGGAGTGG AGGCGGCCCG GCCGTCGAGG 
GACGCTCCTG CCAGAGGGCA GTCCTCTGCG TCCTCTACAG CGGCGACCGG GGTGCGACTG 
TTCGGAACCA TAGAATTCAG GGGCCAGTTG AAGGCTCTTC CGAAATGGTC GCGGGTGGTC 
GAGACGGAAC GCAAGAAACC CGGACTGTAT CTGGACAGGG CTCTTGGCGG CAAGGGCGGG 
CAGGTCTGGC GGGAGTTGCG TGGCGAATGG CAGGGCTTGC CGCTGATGGA GAGGTTGAAG 
AAGGTCAACA CGTTTTTCAA CCAGTGGCCG TACAGGCTTG ATAGTGAAAA CTACGGATTG 
CCGGACTATT GGGCGACGCC CGACGAATTC CTCAGAAAGT CCGGTGACTG TGAGGACTAT 
AGCATCATCA AGTATTTCGC CCTGAAGCAG CTAGGGGTTT CTGCCGATTC GATGCGCATA 
GTCGTTCTGC TTGACAAGAT CAGGGGCATT GCCCACGCAG TGCTGGCCGT CTACGATGGT 
AATACGGCGT ATATACTTGA TAACCTTTCC GGACTCGTGC TGGCTCATGA TTTCTACAAG 
CACTACGTCC CCCAGTATTC GGTGAACGAA TCCTACAGGT GGGCACACAT CCCCCTCGGG 
AAGAAAGCCG GGAGGAAATG A

Protein sequence

MAKARERQWQ EGPYARFSFC AAVVVLLCLF VPTFFLGLPG DTEAGGASPK AAPYEPRDGE 
AVTRGESEQR ASSRHVIGQA PDPQQAPDAR VIASEAPASP ADTDVRGERK VPGTTGEDAS 
SNRPEVSPVL EVAADGPLRH VRPEDMRGGA QQSPVQPSGQ RGHRAGATSD GTPDGGEHSG 
NAATAEDGEG QGVEAARPSR DAPARGQSSA SSTAATGVRL FGTIEFRGQL KALPKWSRVV 
ETERKKPGLY LDRALGGKGG QVWRELRGEW QGLPLMERLK KVNTFFNQWP YRLDSENYGL 
PDYWATPDEF LRKSGDCEDY SIIKYFALKQ LGVSADSMRI VVLLDKIRGI AHAVLAVYDG 
NTAYILDNLS GLVLAHDFYK HYVPQYSVNE SYRWAHIPLG KKAGRK