Gene Dtur_1495 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtur_1495
Symbol
ID	7081930
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dictyoglomus turgidum DSM 6724
Kingdom	Bacteria
Replicon accession	NC_011661
Strand	+
Start bp	1505762
End bp	1506823
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	36%
IMG OID	643458604
Product	Cellulase
Protein accession	YP_002353383
Protein GI	217967877
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1363] Cellulase M and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGATC TATTAAATAT GCTCAAAGAA ATCACAGAAG CTCCTGGAGT ATCAGGATAT 
GAGAAAGGGA TAAGAGAAGT CTTAAAAAAA TATCTATCTG AAATTGCAGT ATTAGAAGAG 
GATCGTCTTG GAAGCTTGAT ATTTAAAAAA CAAGGCTCTA AAGAAACTCC AAAAGTAATG 
CTAGCAGCTC ATATGGATGA AATTGGATTC ATGGTAAAAA GCATAACTTC CAACGGCTTT 
ATAAAATTCC TACCTCTTGG AGGCTGGTGG GATCAGGTTC TTTTATCTCA AAGGGTAATT 
ATACATACCC AAAATGGTCC CATCGTAGGA GTAATAGGTT CTAAACCCCC TCATATATTA 
TCAGAAGAGG AAAGAAAAAA AGTAGTAGAA AAGAAAGATA TGTATATTGA TATTGGAGCA 
AATAGCGAGG AAGAAGCCTT AAATTGGGGA GTAAGACCTG GAGACCCTAT AACCCCTTAT 
AGTGAATTCC AAGTAATGCA TAACCCTGAT TTTCTCTTAG CTAAGGCATG GGATGATAGG 
GTGGGATGTG CCCTTCTTGT GGAAATAATA AAAGAACTGA AAAATATAGA TCATCCTAAC 
ACCATATATG GAGCTGCTAC AGTCCAAGAG GAAATAGGAC TAAGAGGAGC AACCACATCC 
TCTTTTGTAG TTAATCCTGA TGTCGCCATT ATATTAGAAT CTGATATCGC TACAGATGTA 
CCAGGCATAA ACGAAGAAAA GAGGATCTAT TTAGGAAAAG GTCCTTCTAT AATAATTTAC 
GATGCTACCA TGATTCCTAA CTCCAACTTA AGAAGAATAT TTATAGAAAC TGCTGAAAAA 
CTAAATATAC CAATACAATA TTCTGCTCTT GAAAGAGGAG GAACCGATGG GGGAAGAATT 
CACATTCATG CTAAAGGTGT ACCTTCAATA GTAGTTGGCG TGCCTGCAAG ATATATCCAT 
TCTCATACCA GTATTATTAA TGTGAAAGAT TTCTTAAATG CCAAAAAACT GATAGTGGAA 
GTTATCAAGA GTCTTAATAA GGAAATAGTA GAGAGTCTAT GA

Protein sequence

MSDLLNMLKE ITEAPGVSGY EKGIREVLKK YLSEIAVLEE DRLGSLIFKK QGSKETPKVM 
LAAHMDEIGF MVKSITSNGF IKFLPLGGWW DQVLLSQRVI IHTQNGPIVG VIGSKPPHIL 
SEEERKKVVE KKDMYIDIGA NSEEEALNWG VRPGDPITPY SEFQVMHNPD FLLAKAWDDR 
VGCALLVEII KELKNIDHPN TIYGAATVQE EIGLRGATTS SFVVNPDVAI ILESDIATDV 
PGINEEKRIY LGKGPSIIIY DATMIPNSNL RRIFIETAEK LNIPIQYSAL ERGGTDGGRI 
HIHAKGVPSI VVGVPARYIH SHTSIINVKD FLNAKKLIVE VIKSLNKEIV ESL