Gene Dhaf_0072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dhaf_0072
Symbol
ID	7257021
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfitobacterium hafniense DCB-2
Kingdom	Bacteria
Replicon accession	NC_011830
Strand	+
Start bp	72606
End bp	73760
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	47%
IMG OID	643559975
Product	glycoside hydrolase family 18
Protein accession	YP_002456577
Protein GI	219666142
COG category	[R] General function prediction only
COG ID	[COG3858] Predicted glycosyl hydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0000000514122
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCGGT TTCTGACTTT AAATTTAATA GCTGTTTTGG TATTGAGTTT TAGCTTGGTT 
GGGTGTAATA CAGCGCAGCA GCAAAACACC CAAGCACCGA ATCAGATCGC CACGGAAAGC 
GGCGAACCTC CAAAAGCTGA GGCAGAGACT CGTCAGGATG TTCTAGGGGA AGAGAAACGG 
GTGGTCATGG GTTTCTATAC GGACCCTGAA GGAGAGATCC CCGGCTCCAA GGAATCAATG 
ATGAAGAACA TCAAATTGAT GGATGAGGTT TCCTTCTTCT GGTATAGTTT TGATGCCAAT 
GGAAAAATTC TCACCACAGG GAAAAAAGAT CTCAGCATTA AAGAAGCAGC GCAAAAGAAT 
GGAGCTAAAG CCTACGCTTT AATTCATAAT ATGCGCGGCG GCCTCTTCGA TGCCAACCTG 
GCCCACAGTG TGTTCGCCAA TCCTCAGACC CGCTCTAAGT TTATCAACAA TATTGTGCAA 
CTGGTTATCA ATGAGAAATG GGATGGTGTG GCCATTGATA TTGAAAAGAC ACCACCCGCT 
GACCGCAACA ACTTCACAGC CTTCTTAGGT GAGCTTCACG GTGCCTTAAA GGCTAAAGAC 
AAGGTGCTCA ACGTCTCCAT TCCGGCTAAG TTTATCGATT ACCCATCCGA CCTTTGGTCC 
GGGGCTTATG ATTATGCTTC CATCGGTAAA AATGCCGACC AAATCGTGCT GATGACCTAT 
GACGAGCATG GACTGGGAAC CACCCATGGA CCCATATCCT CCCACGCCTG GGTCAATAAA 
GTCATCTCCT ATGCAGTGAC CAAAATCCCC AGGGAAAAAA TCGTCTTAGG ACTTCCTGTC 
TACTCCTTTG ACTGGGGTTC CAACAAGCCC ACCATGCCCG ACTATCTCTC TTATGAGCAA 
AGCATGGCCC GTGCCAAAAA ACATGGGGTG GAAGTTGGCT ATGATGAAGA GCATAAAGTT 
CCCTGGTATA CCTACACAGC CAATGGTGTC CGTCATGAAG TATACTTTGA AAACAAGCAA 
AGCCTGCAGC CCAAGATGGA ATATGCCCGG GAGCATAAGC TTCATGGCGT AGCTATCTGG 
AGATTGGGGA TGGAAGATCC CTCCATCTGG GACAGCTTGG TCAAGACTTA CGGAACCAAT 
AAAAATAAGA AATAA

Protein sequence

MKRFLTLNLI AVLVLSFSLV GCNTAQQQNT QAPNQIATES GEPPKAEAET RQDVLGEEKR 
VVMGFYTDPE GEIPGSKESM MKNIKLMDEV SFFWYSFDAN GKILTTGKKD LSIKEAAQKN 
GAKAYALIHN MRGGLFDANL AHSVFANPQT RSKFINNIVQ LVINEKWDGV AIDIEKTPPA 
DRNNFTAFLG ELHGALKAKD KVLNVSIPAK FIDYPSDLWS GAYDYASIGK NADQIVLMTY 
DEHGLGTTHG PISSHAWVNK VISYAVTKIP REKIVLGLPV YSFDWGSNKP TMPDYLSYEQ 
SMARAKKHGV EVGYDEEHKV PWYTYTANGV RHEVYFENKQ SLQPKMEYAR EHKLHGVAIW 
RLGMEDPSIW DSLVKTYGTN KNKK