Gene Dde_3036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dde_3036
Symbol
ID	3758028
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio desulfuricans subsp. desulfuricans str. G20
Kingdom	Bacteria
Replicon accession	NC_007519
Strand	-
Start bp	3023767
End bp	3025095
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	58%
IMG OID	637783944
Product	CBS
Protein accession	YP_389525
Protein GI	78358076
COG category	[R] General function prediction only
COG ID	[COG1253] Hemolysins and related proteins containing CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGATATTG CCATTCTTGT TGCCCTGATA CTTCTTAACG GCGTTTTTGC CATGTCCGAG 
ATAGCCCTTG TCACCGCCCG CAGAAGCCGT CTGCAAAAAA TGGCGGAAGA AGGTGACCGT 
TCCGCAGCCG TGGCCATCCG GCTGGGTGAA GAGCCTACCC AGTTTCTTTC CACTGTGCAG 
ATAGGCATAA CGGCCATAGG CATACTGAAC GGCATAGTGG GAGAAGCCGC ACTGGCCGGG 
CCTCTTGCCC TGATGCTGCA GAATGCCGGT CTGGAAAGCG GGACAAGCTC GGCCGTGGCA 
ACCACAGTTG TGGTGGCGGG CATCACCTAT TTTTCCATTG TGGCGGGCGA ACTGGTGCCC 
AAACGCATAG CGCAGTTCAA TGCCGAAGGC ATAGCGCGCA GCATGGCCAG ACCCATAGCC 
CTGCTGGCCT GTCTGTCGCG TCCGTTTGTG TATCTGCTTT CTGTTTCCAC GGATGCCCTG 
CTGCGGCTGG TGGGCAAAAC TGAACTGAGC AGCGCCAACC TGACCGAGGA GGACATCCAC 
GCCATACTGA CGGAAGGTTC ACAGGCGGGT GTCATCGAAA AACACGAGCA TGATATGGTG 
CGTAATGTCT TTCGTCTTGA CGACAGGCAG ATTCCTTCGC TGATGACTCC GCGCAGCGAT 
ATTGTGTTTC TGGATATCAC GCAGCCGCTT GACGGGTTTC TGGACACAGT GGTGGCCTCT 
GATCATTCCC GCTTTCCGGT ATGCCGCGGC GGTCTGCACG AGGTGCTGGG CGTCATCAGT 
GCCAAGCGTC TGCTCAAGCA GCGGCTGAAA AACGAACCGG CAGAAAAACT GACCGGATAT 
CTGCTGCCGG CTGTGTATGT GCCGGAGTCG CTGACGGGCA TGAAGCTGCT TGAACAGTTC 
CGGGAATCCG GTGTGCAGAT GGTTTTTGTG GTTGATGAAT ACGGTGATAT TTCCGGTCTG 
ATCACGTTGC AGGACCTGCT GGAAGCGCTC ACAGGAAAGT TCCGCCCGCG CGATCCGGAC 
GAAATGTGGG CTGTGCAGCG TGACGACGGT TCGTGGCTGC TGGACGGGCT TATCCCTGTG 
CCGGAACTGA AGGACAGGCT TGACCTCAAA ACCGTGCCCG ACGAGGCAAA AGTCCGCTAT 
CATACCTTGA GCGGCATGAT GATGTGGCTT TTCGGCCGGT TGCCGCGTAC AGGTGATGTG 
GCGGAGTGGC AGGGCTGGCA GCTGGAAGTT GTGGATCTTG ACGGCAAGCG CATCGACAAG 
GTGCTGGCCA GCAGGATTTC CGGTTACGAG GCTTCGCAGC CGTCTGCGGC TGGTCCGGAC 
GGGCGCTGA

Protein sequence

MDIAILVALI LLNGVFAMSE IALVTARRSR LQKMAEEGDR SAAVAIRLGE EPTQFLSTVQ 
IGITAIGILN GIVGEAALAG PLALMLQNAG LESGTSSAVA TTVVVAGITY FSIVAGELVP 
KRIAQFNAEG IARSMARPIA LLACLSRPFV YLLSVSTDAL LRLVGKTELS SANLTEEDIH 
AILTEGSQAG VIEKHEHDMV RNVFRLDDRQ IPSLMTPRSD IVFLDITQPL DGFLDTVVAS 
DHSRFPVCRG GLHEVLGVIS AKRLLKQRLK NEPAEKLTGY LLPAVYVPES LTGMKLLEQF 
RESGVQMVFV VDEYGDISGL ITLQDLLEAL TGKFRPRDPD EMWAVQRDDG SWLLDGLIPV 
PELKDRLDLK TVPDEAKVRY HTLSGMMMWL FGRLPRTGDV AEWQGWQLEV VDLDGKRIDK 
VLASRISGYE ASQPSAAGPD GR