Gene Cmaq_0708 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_0708
Symbol
ID	5708597
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	-
Start bp	742068
End bp	743183
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	43%
IMG OID	641275206
Product	xylose isomerase domain-containing protein
Protein accession	YP_001540534
Protein GI	159041282
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG4952] Predicted sugar isomerase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.00278763
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.000000000165231
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCATGA GTATAAGTAG GTTAAAGTCA ACCTACTCAG GTTTCATAGA GGGTAAGACT 
GTTGATCAAT TTTTCAGTGA GTATAATGTT AAGTTCGCTG CAGGTACATG GACTGCTGGG 
GATTTCTCAG ATAGATTCAA TAGAAGTGGT TACTTCCCGA ATCTACCAAG AGGGTTAGTG 
GATCAGTTAA GGAGGGTGAG GGAGTCTGGG ATTGAGGGTG TCGTGCCAAT AGATGCTCAA 
TTCCTTGACG ATAATCTTAA GGTTAAGGAG GACTTGATAA ATGAAGTTAA GGCAACTGCA 
AGTGAATTAG GCCTTAAGAT AGCTGGGTTA GGTATGGATA TTTCAGGTTT CCACGTGTTT 
AAACTAGGTT CATTAACTAA CCCTGACCCT AAGGTGAGGG AACTGGCCTT AAGCACCCTT 
ACCCAGAGCC TTGAAATAGC CCGTATGCTT GGCCTGGATT CAGTATCACT TTGGCTTGGT 
CCAGATGGCT GGGATTACAG TCTTGAGTCT AATTACGGTA AGAAGATTAA GGAACTTTAC 
GAGGGGTTAC TTACCCTAGG TAAGGAGGCG CATAGGTTGG GCATTAGGTC TTTTGGACTT 
GAGGCTAAGC CCAAGGAGCC TAGGGAGGGT AATTTAATCA TACCCACATC CCATGTTTCA 
ATAATGCTCG CTAACAGGCT AAATAATGAT TTAGGTGTAA AACTGTTTGG AATAACCATA 
GACTATGGTC ATGAATTAAT GTACGCCGTT GAACCAGCCT ACACAGTCTA CTTAGCTAAG 
GAGCAGGGAG TCTCAGTGGC CACGGTGCAT ATTAATACAG CTAAGTGGCA TAGTAATGAT 
GAGGACAGGG TTGTTGGAAC TGGGGACGCA TGGCACTTCG TAGACTTCCT ATACGCACTA 
CTGGACACTG GTTACTCAGG CTGGTTTACC CTGGATCAAT TCACTTATAG GCTTAATCCA 
GTGGATGGGT TAAGGTTATC TAAGGAATTA TTCGCTAACC TGTATAAGAA GGCTCTGGCA 
CTATACTTAT CTAGGGATGA GTTTGAGAAC ATTAGGTCCA CGGGTGATCA AGCTAAGATA 
CTTGACTACG TTAAGAGGAT AATGTACGGC TTATGA

Protein sequence

MSMSISRLKS TYSGFIEGKT VDQFFSEYNV KFAAGTWTAG DFSDRFNRSG YFPNLPRGLV 
DQLRRVRESG IEGVVPIDAQ FLDDNLKVKE DLINEVKATA SELGLKIAGL GMDISGFHVF 
KLGSLTNPDP KVRELALSTL TQSLEIARML GLDSVSLWLG PDGWDYSLES NYGKKIKELY 
EGLLTLGKEA HRLGIRSFGL EAKPKEPREG NLIIPTSHVS IMLANRLNND LGVKLFGITI 
DYGHELMYAV EPAYTVYLAK EQGVSVATVH INTAKWHSND EDRVVGTGDA WHFVDFLYAL 
LDTGYSGWFT LDQFTYRLNP VDGLRLSKEL FANLYKKALA LYLSRDEFEN IRSTGDQAKI 
LDYVKRIMYG L