Gene Nther_0313 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nther_0313
Symbol
ID	6316146
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natranaerobius thermophilus JW/NM-WN-LF
Kingdom	Bacteria
Replicon accession	NC_010718
Strand	+
Start bp	329673
End bp	330701
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	39%
IMG OID	642642699
Product	Cellulase
Protein accession	YP_001916499
Protein GI	188584954
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1363] Cellulase M and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	58
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGCTAT TGAAAAAACT CACTCAAACA CCTGGAATAC CGGGAAGAGA GGAGCCTATT 
GCGGAATTAA TCAAAGAAGA AATGAACCAA ATTTGCGATG AAGTATGGGT AGATCCCTTG 
GGAAGTGTAA TAGGACTTAA AAAAGGTAAT GGAAACAAAA AGGTAATGGT TGCTGGTCAC 
ATGGATGAGA TAGGTTTTAT AGTAAAGCAT ATCGATAAGA ATGGATTTAT TCGCTTACAG 
CCTGTAGGTG GCTTCGATCC CCGAAGTTTA ATGGCTCAAA GGGTGATTGT TCATGGAAAG 
GAAGACTTGA TTGGCAATTT AGCCCCAGCT ACTAAGCCAA TTCATGTCTT GAGTCCTGAA 
GAGAAGAAAA AACAACTTCA AGTAAAGGAT TATTTTGTTG ATTTGGGTCT TTCTGGTGAA 
AAAGTCAAGG AATTGGTAGA AATCGGTGAC CCTGTCACCC TAAAACAAGA TTTTGAAGAA 
ATCGGGAACA TGTATAGTAG TAAATCCCTT GATGACAGAG TGGGAGTATA TGTCATGTTA 
GAAGCTGCAA AACAGCTTAA GGACCATGAT GCAGATATTT ATCTTGTAGC TACCTCTCAG 
GAGGAAGTGG GTATTAGAGG AGCCATGACA TCTTCTTATG GCATCGAGCC TGATGTAGGC 
ATTGCCCTTG ATGTGACTAT AGCGGCAGAT ACTCCAGGAA GCGAGGAATC AGAACAGGTT 
ACCAAATTAG GTGAAGGTGC AGCTATTAAA ATTATGGACT CTGCTAGCAT AACTAATAGA 
AAAGTACTTC AGACATTAAA AGACCTAGCC AATGAAAAAG ATATTAATCA TCAAATGGAA 
ATACTACCTA AAGGAGGAAC CGATGCTGGT TCAATCCAGA GAAGCAAATC TGGAATTCCT 
GTGGGGACAA TATCTATACC ATGCAGGTAT GTACATACAG TCAATGAAAT GATCCATAAA 
GAGGATTTAG ATGCGTCAGT AAACTTACTA TCTGCTTTCC TTGCTGAAGC AAATTTTAAC 
GAATTTTAA

Protein sequence

MELLKKLTQT PGIPGREEPI AELIKEEMNQ ICDEVWVDPL GSVIGLKKGN GNKKVMVAGH 
MDEIGFIVKH IDKNGFIRLQ PVGGFDPRSL MAQRVIVHGK EDLIGNLAPA TKPIHVLSPE 
EKKKQLQVKD YFVDLGLSGE KVKELVEIGD PVTLKQDFEE IGNMYSSKSL DDRVGVYVML 
EAAKQLKDHD ADIYLVATSQ EEVGIRGAMT SSYGIEPDVG IALDVTIAAD TPGSEESEQV 
TKLGEGAAIK IMDSASITNR KVLQTLKDLA NEKDINHQME ILPKGGTDAG SIQRSKSGIP 
VGTISIPCRY VHTVNEMIHK EDLDASVNLL SAFLAEANFN EF