Gene Cmaq_0206 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_0206
Symbol
ID	5709701
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	+
Start bp	243755
End bp	244807
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	45%
IMG OID	641274709
Product	cellulase
Protein accession	YP_001540045
Protein GI	159040793
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1363] Cellulase M and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGCCG CAACATTATC TAAACTAACC CTTGAGATTG GCCCATCAGG TTTCGAAGAT 
AGGGTGATAA GAACAATAAT AAGCATGATT AGAAATCGTG TTGATGAAGT TAATGTAGAT 
AACATGGGTA ACCTAATAGC GAGGATTGGT AATGGTCCTT TTAAACTAAT GATAAGTGCC 
CATGCTGATG AAGTAGGTGT TATGGTTTCA CACATTGATC AAAGAGGCTT CATTAAGGTT 
GTTCCAATAG GTGGGATTGA TCCATGGGTT ATGATTGAGC AGGAGTTAGT TTTCATGGGA 
CGTAACGGTG ACATATATGG CACTGTTGGT GTTGATCCAC CGCACTTAAG GAGGGATAAG 
CCTCCATCCA GGTTTGAGGA GCTTTACGTT GATGCCGGCT TCACCTCTAA TGATGAAGCC 
TTTAAGGCAG GTATATTACC TGGTGTGGCA GGGACCTTTG CGGCGTCATT TAGGGAGAGG 
GGCAGTGTAG TAATAGGTAA GGCGTTAGAT AATAGAGTCG GCTGCAGTGT ACTTGTGGAT 
TTAGCTGAGG AGGCTGGGGG AATGGTTACC GGTGACTTAT CCCTTTACCT GGTTTGGAAT 
ACGCAGGAGG AGGTTGGGTT AAGGGGTATA AATGCGGCTG TTAACGCCAT TAACCCAAAC 
ATGGCCATTG TCGTTGAAAC AACCGTTGCC GCAGATGTTC CAACTAATCC CGAGAATGAA 
TGGATAACTA GGATAGGTAA TGGTGCTGCA ATTAGGGCTT TAGATAGATC CATGATAACT 
AACCCACGGT TACTATCAGC CGTATTGGAG TTAGCATCAT CAAGGGGAAT TAAGTACCAG 
GTTCAAGTCA ACCCATATGG TGGCACTGAC GCCGGTGCTA TACATGTCCA CGGTACAGGT 
GTACCAACAG TAGTTGTATC TACACCAGCC AGGTATATCC ACACACCCCA CTCAGTGGTT 
AATCTCAGTG ATGTTGAGCA GGTTAAGTCA ATGATCACCC TAATAGTGAG GGAACATGCT 
GAATTAAGTA GGGTAATGAG GATTCAGGCT TAA

Protein sequence

MDAATLSKLT LEIGPSGFED RVIRTIISMI RNRVDEVNVD NMGNLIARIG NGPFKLMISA 
HADEVGVMVS HIDQRGFIKV VPIGGIDPWV MIEQELVFMG RNGDIYGTVG VDPPHLRRDK 
PPSRFEELYV DAGFTSNDEA FKAGILPGVA GTFAASFRER GSVVIGKALD NRVGCSVLVD 
LAEEAGGMVT GDLSLYLVWN TQEEVGLRGI NAAVNAINPN MAIVVETTVA ADVPTNPENE 
WITRIGNGAA IRALDRSMIT NPRLLSAVLE LASSRGIKYQ VQVNPYGGTD AGAIHVHGTG 
VPTVVVSTPA RYIHTPHSVV NLSDVEQVKS MITLIVREHA ELSRVMRIQA