Gene Dbac_2074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dbac_2074
Symbol
ID	8377749
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfomicrobium baculatum DSM 4028
Kingdom	Bacteria
Replicon accession	NC_013173
Strand	-
Start bp	2378838
End bp	2380775
Gene Length	1938 bp
Protein Length	645 aa
Translation table	11
GC content	65%
IMG OID	645001298
Product	transglutaminase domain protein
Protein accession	YP_003158575
Protein GI	256829847
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1305] Transglutaminase-like enzymes, putative cysteine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.618768
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTCACG ACAAGCGCCG CTTCAGCGTG ACGCTGCTGG CCCTGGCTCT GGCCTTCGCG 
CCGCATCTGC CGCGCGTGCC GGTCTTTGTC GGCTTTTTTG TCTTTCTGGC CTGGGGCTAC 
GCCCTGGGGA TGCAGTACCG GGGCTGGCCC GTCCCTCCCC GTTGGCTGCG CGCCATCCTG 
GCCCTGGCCT GTCTTGCCCT GGTGCTCTCC ACGTACGGCC GATCCTTTGG ACGTGACGCC 
GGAGTGGCCC TGCTGTCACT CATGCTGGGG CTCAAGGCCG TGGAGAGCAA ATCCGTGCGC 
GACATGCTGG CCCTCTTGTT CCTGGCATAT TTCGTGGTCG TGACCAACGT GCTTTATTCC 
CAGACCCTGG TCATGAGCGC GTACATGTTT TTTTCGGTCA TGGCCGTGAC CGCGGCCCTG 
GTTCATCTGC ATTCCGGGGA ACCCCGCCTG CTCCCCGATC TGCGGCGCGG GGGGCTGCTT 
CTCGTCCAGG CCCTGCCGTT GGCCTTGATT CTTTTCGTCT TTTTTCCGCG TCTGCAGGGC 
GCCCTGTGGG GCGTGCACGA TGAACGGGAC GAAGGTGTCA GCGGCTTCAG CGAGACGCTG 
GAGCCGGGTT CGGTGGCCAG TCTGTCCCTG TCCCGGGAGG TGGCCTTCAG GGTCGATTTT 
CCCGGCACCA TCCCTGACCG TGACAGTCTG TATTGGCGCG GGCTGGTGCT GGACAGTTTC 
GATGGCATGA CATGGTTTCG GGATGTGCCT TTCGACCTCG TTCCTCCGCG TATTGATGCC 
CTCCCCGCGC AAAGCGTGTC CTACACGCTG ACCATGGAAC CGCACAACAG GGAGTGGGTT 
TTTGCCCTTG ATCTGCCCGT GCTCGCGCCT CGGGGCACGG TGCTGCGGTC CGATCAGACG 
CTGGCCAGCC TGCGCATGGT CCGCTCGCGG GTGCGTTACG AACTCGCGGC GGTCCAGGCT 
CCCGGTCTCT CGCCTGTTCC TGGCCCTGCG TGGACCGCAC TGCCCGAGGT CGGCAATCCC 
AAGGCGCGCG CCCTGGCCGC TGAATGGAAG GACGCGGGCC TCTCGCCGGA CGAGATGGTC 
GCGGCCGCGC TCAAACTTTT CCGGGAGGGC GGGTTTGTCT ACAGCCTGCG GCCCGGAGCC 
GCGGACAAAG ACATCGTTGA TCAGTTTTTG TTTGCAACCC GCCTGGGATA TTGCGAACAT 
TACTCCTCGG CCATGGCCTT TCTGCTTCGC GCCGCCGGGG TTCCGGTCCG GGTCGTGGTC 
GGCTATCAGG GCGGGGAAGA GAATCCCATG GGCGGATATC TCATTGTCCG TCAGTCCGAC 
GCCCACGCCT GGGTCGAAGT CTGGACGGAC GGCCGCTGGC TGCGCGTCGA CCCCACCTCC 
GTGGTCGCTC CGCAGCGTCT GGTGACGGGG GTGGAGTCCT TCGTGCCCCA GGGGCAGGGC 
GGAGTGTTGC CCGAAGGGGC TCAGGCCCTG CGCAAAGTGG GACGTTTTTT TCAGCTGGGC 
TGGGACGCGG CCAACAACTC CTGGAATCAA TGGGTGCTGG GCTTCAGCCA CGACAGGCAG 
CGAAGCTTGT GGGAGCGCCT GGGCATCGAT TCGACCACCA GGGCCGGGGC CGGAAAGCTG 
GCGGGCGTCC TGGCCGTGGG GCTGTGCATC ATTCTGGGCG GGGTGTTCGG CGTCATACTG 
CGCTCGCGGC ATGGCGAGCG GGATCAGGCT ACGTTTTTGT ACGGCCGTTT TTGCCGCAAA 
TTGGCCAGGC TCGGATTGGC CAGGGGACTG GCCGAGGGGC CGCGCGATTA TGCTCGGCGC 
ATAGGTAGGC AGCGCCCCGA ACTGGCCCTG GCTGCCCGGT CTATTGTCGA CGCGTATGTC 
GCTTTGCGCT ACAGTGGCCG GGGGGATTTG GCGGCATTCA AACGACTGAT CGACGAATTC 
ATGGGGAGAA AGATTTGA

Protein sequence

MIHDKRRFSV TLLALALAFA PHLPRVPVFV GFFVFLAWGY ALGMQYRGWP VPPRWLRAIL 
ALACLALVLS TYGRSFGRDA GVALLSLMLG LKAVESKSVR DMLALLFLAY FVVVTNVLYS 
QTLVMSAYMF FSVMAVTAAL VHLHSGEPRL LPDLRRGGLL LVQALPLALI LFVFFPRLQG 
ALWGVHDERD EGVSGFSETL EPGSVASLSL SREVAFRVDF PGTIPDRDSL YWRGLVLDSF 
DGMTWFRDVP FDLVPPRIDA LPAQSVSYTL TMEPHNREWV FALDLPVLAP RGTVLRSDQT 
LASLRMVRSR VRYELAAVQA PGLSPVPGPA WTALPEVGNP KARALAAEWK DAGLSPDEMV 
AAALKLFREG GFVYSLRPGA ADKDIVDQFL FATRLGYCEH YSSAMAFLLR AAGVPVRVVV 
GYQGGEENPM GGYLIVRQSD AHAWVEVWTD GRWLRVDPTS VVAPQRLVTG VESFVPQGQG 
GVLPEGAQAL RKVGRFFQLG WDAANNSWNQ WVLGFSHDRQ RSLWERLGID STTRAGAGKL 
AGVLAVGLCI ILGGVFGVIL RSRHGERDQA TFLYGRFCRK LARLGLARGL AEGPRDYARR 
IGRQRPELAL AARSIVDAYV ALRYSGRGDL AAFKRLIDEF MGRKI