Gene Cmaq_0950 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_0950
Symbol
ID	5708834
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	+
Start bp	998225
End bp	999379
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	44%
IMG OID	641275451
Product	cellulase
Protein accession	YP_001540772
Protein GI	159041520
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1363] Cellulase M and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.374031
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAATAATT ATAAAGCTAA GTTAAGTGTA GTCATTATGA GTAATGAGGA ATTCATAAAC 
CTACTCAAGG AACTCTCCGA GGCGTTCGGT CCCTCTGGCT TTGAGGATGA GGTTAGGGAA 
TTAGTGATTA AGGAAATGGA ACCTTACGTG GATGAATTGG AGGTGGATAA ATGGGGTAAT 
GTTATTGGTG TTAGGTACGG TAGTAGGAGG GATCTTAAGG TAATGATTGC AGCCCATATG 
GATGAGATAG GTTTACTTAT TGATAGTATT GATAAGAATG GTTTCCTAAG GTTTAGGGGT 
ATTGGGGGAT GGAATGAGGT AACTTTAGTT GGTCAAAGAG TAATCATTAA GACTCAGGAT 
GGTGGAAAAA TAAAAGGTGT AGTGGGTAGT AGGCCTCCGC ATGTGACGCC TCCAGGAAAG 
GAGAGGGAGG CTCCGGAGAT GAAGGAATTA TTCATTGATA TTGGGGCAAG TGATTCAAGT 
GAGGTTGAGA AACTTGGGGT GAGGGTTGGT TCAGTGGCGG TATTGGATAG GTCCTTTGAG 
GTCCTTAATA ATGATACTGT AACCGGTAAG GCATTTGATG ACAGGGTTGG GTTAGCTGTA 
ATGCTGTGGA TGCTTAGGCA ATTAAAGAAC CATGAGGTAA CAGTGTACAC TGTAGCCACT 
GTTCAAGAGG AGGTTGGGTT AAAGGGTGCG CAGGTTGCCG CTGACAGGGT TTACCCAGAC 
TTCGCAATAG CCTTAGATAC AACCATAGCT GCTGACGTAC CTGGTGTATC TGAGCGTGAA 
TACGTGTCTA GGCTTGGTGC AGGTCCAGCA TTAAAAATAA TGGATGGTGG AAGGGGCGGC 
TTATTCATAG CCCACCCAGG CTTAACTAAC TACATTATTA ATATAGCTAA GGCTAATAAT 
GTGCCGTATC AATTAGAGGT ATTGATTGGA GGCACCACTG ATGCTGCTGG TATAGCCTTA 
AGGAGGGATG GAATACCTGC AGCAACAATC TCAATACCCA CCAGGTACGT TCACTCACCT 
GTGGAGGTGC TTAAGGTAAG TGATGCAGTT AATGCATCAA GACTACTCAC GCTAGTGGTT 
CAAGGGGCTA ATGAAGGGTT AATAAGCAGT CTTAGGAGTA GGGTGATTAA GGGTGTTGGG 
TTTAAGGTGA CTTGA

Protein sequence

MNNYKAKLSV VIMSNEEFIN LLKELSEAFG PSGFEDEVRE LVIKEMEPYV DELEVDKWGN 
VIGVRYGSRR DLKVMIAAHM DEIGLLIDSI DKNGFLRFRG IGGWNEVTLV GQRVIIKTQD 
GGKIKGVVGS RPPHVTPPGK EREAPEMKEL FIDIGASDSS EVEKLGVRVG SVAVLDRSFE 
VLNNDTVTGK AFDDRVGLAV MLWMLRQLKN HEVTVYTVAT VQEEVGLKGA QVAADRVYPD 
FAIALDTTIA ADVPGVSERE YVSRLGAGPA LKIMDGGRGG LFIAHPGLTN YIINIAKANN 
VPYQLEVLIG GTTDAAGIAL RRDGIPAATI SIPTRYVHSP VEVLKVSDAV NASRLLTLVV 
QGANEGLISS LRSRVIKGVG FKVT