Gene Dfer_0289 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dfer_0289
Symbol
ID	8223855
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dyadobacter fermentans DSM 18053
Kingdom	Bacteria
Replicon accession	NC_013037
Strand	+
Start bp	327578
End bp	328714
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	57%
IMG OID	644928167
Product	glycoside hydrolase family 5
Protein accession	YP_003084724
Protein GI	255034103
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2730] Endoglucanase
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.014441
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATCGCA GGACATTCAT ACAAAATACA TCCATCGCAC TGGCCGGGGC CGCATTGGCT 
CCCGGCCTTG CCGTTTCGGG CCAGGCAGCG CAGAACAAGC TGCCCAAATG GAAAGGCTTC 
AATCTACTCG ATTTCTTTTC GCCAGACCCC GCCAAAGGCC GTAAGCCCAC CACCGAGGAA 
CAGCTCAAAT GGATGAGCGA CTGGGGCTTC GATTTCATTC GCATTCCGAT GGCCTACCCG 
GCTTACCTTA AATTCGATCG CAGCAAAAAC ATCACGCCGG AAGAAGTGTA CCAGATCGAC 
GAGCGGGCCG TGGAACGGAT CGATAAGCTC GTGGCCGCGG CGCACAAATA CAACATGCAC 
GTGAGCCTGA ACCTCCACCG GGCGCCGGGT TACTGCATTA ATGCGGGTTT TAACGAACCC 
TACAACCTCT GGACCGACCA GAAAGCCCTC GATGCATTCT GCTTCCACTG GAATATGTGG 
GCTAAACAAT ATAAAAATGT GAGCTCTGCA CGGATCAGCT TCGACCTGCT GAACGAGCCG 
AGCATGCGCG CGGATATGAA CGACCAGCAT TCGAAACGCT CATCGGTGCC TGGTGACGTT 
TACCGCAAAC TCGCGATTGC CGCGTCGGAA GCGATCCGGA AGGAAAACCC GGGACACCTG 
ATCATCGCCG ACGGCAACGA CGTAGGTACA TCGGTCATCC CCGAGCTGGC CGACCTCGAC 
ATTGCACAAA GCTGCCGCGG CTACCACCCG GGCATTATTT CGCATTACAA AGCGCCCTGG 
GCCACGAAAG ATCCCGACAA TGTGCCGGAA CCAAAATGGC CCGGGCAGGT AGGCGACCAA 
TACCTCAGCC GGGCCATGCT GGAAAAGTTT TACAAGCCGT GGATTGAGCT CGTCAAAAAG 
GGCGTGGGCG TGCATTGCGG CGAATGCGGC TGCTGGAATA AAACGCCGCA CGCGGTTTTT 
CTGGCCTGGT TTAACGACGT GCTCGACATC CTGTCATCGA ACGGCATCGG CTTTTCGCTA 
TGGGAATTCG CCGGCGACTT CGGCGTGCTC GACTCCCGCC GCGATGATGT TGCGTACGAA 
GACTGGTACG GCCACAAGCT GGACCGCAAG TTGCTCACGC TCCTGATGAA ATACTGA

Protein sequence

MHRRTFIQNT SIALAGAALA PGLAVSGQAA QNKLPKWKGF NLLDFFSPDP AKGRKPTTEE 
QLKWMSDWGF DFIRIPMAYP AYLKFDRSKN ITPEEVYQID ERAVERIDKL VAAAHKYNMH 
VSLNLHRAPG YCINAGFNEP YNLWTDQKAL DAFCFHWNMW AKQYKNVSSA RISFDLLNEP 
SMRADMNDQH SKRSSVPGDV YRKLAIAASE AIRKENPGHL IIADGNDVGT SVIPELADLD 
IAQSCRGYHP GIISHYKAPW ATKDPDNVPE PKWPGQVGDQ YLSRAMLEKF YKPWIELVKK 
GVGVHCGECG CWNKTPHAVF LAWFNDVLDI LSSNGIGFSL WEFAGDFGVL DSRRDDVAYE 
DWYGHKLDRK LLTLLMKY