Gene Cmaq_0652 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_0652
Symbol
ID	5709754
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	-
Start bp	687614
End bp	689074
Gene Length	1461 bp
Protein Length	486 aa
Translation table	11
GC content	48%
IMG OID	641275153
Product	glycoside hydrolase family protein
Protein accession	YP_001540482
Protein GI	159041230
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2723] Beta-glucosidase/6-phospho-beta-glucosidase/beta-galactosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000000739457
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTAAGT TCCCAAGCGA CTTCAGATTC GGCTTCTCCA CAGTGGGTAC TCAGCATGAG 
ATGGGTACCC CTGGTTCTGA ATTCGTAAGT GACTGGTATG TGTGGCTTCA TGACCCTGAG 
AACATTGCTT CGGGCTTAGT TAGCGGTGAT TTACCTGAAC ATGGGCCAGG TTACTGGGAC 
TTGTATAAGC AGGACCACTC AATAGCTAGG GATCTTGGGC TTGATGCAGC ATGGATAACT 
ATTGAGTGGG CTAGGGTGTT CCCTAAGCCG ACCTTTGACG TTAAGGTTAA GGTTGATGAG 
GATGATGGAG GTAACGTGGT TGACGTTGAG GTTAATGAAT CAGCATTAGA GGAGTTACGC 
AGGCTAGCTG ACTTAAATGC TGTTAATCAC TATAGGGGGA TTTTAAGTGA TTGGAAGGAG 
AGGGGTGGTT TACTGGTGAT TAACCTTTAC CACTGGGCTA TGCCTACGTG GCTTCATGAC 
CCAATAGCCG TTAGGAAGAA TGGACCTGAT AGAGCCCCCT CCGGTTGGCT TGATAAGAGA 
TCCGTTATTG AGTTCACTAA GTTCGCAGCC TTCATAGCCC ATGAGTTAGG TGACTTAGCT 
GACATGTGGT ATACGATGAA TGAACCTGGG GTAGTGATAA CTGAGGGTTA CCTTTACGTT 
AAGTCAGGCT TCCCACCAGG TTACCTGGAC TTAAACTCCC TAGCCACTGC GGGTAAGCAT 
TTAATTGAGG CTCATGCCAG AGCCTACGAC GCCATTAAAG CCTACTCAAG GAAACCAGTG 
GGCCTAGTCT ACTCCTTCGC AGACTATCAG CCGCTTAGGC AGGGTGATGA GGAGGCTGTT 
AAGGAGGCTA AGGGACTTGA CTACTCATTC TTCGACGCTC CAATTAAGGG TGAATTAATG 
GGGGTTACTA GGGATGACTT GAAGGGTAGG CTTGACTGGA TTGGGGTAAA CTACTACACT 
AGGGCCGTAT TGAGGAGGAG GCAGGATGCT GGTCGGGCAT CAGTAGCCGT GGTGGATGGA 
TTCGGCTACT CCTGTGAACC TGGAGGCGTA TCTAATGATA GGAGACCATG CAGTGACTTC 
GGCTGGGAAA TATACCCTGA GGGTGTTTAC AATGTCTTAA TGGACCTATG GAGGAGGTAT 
AGGATGCCCA TGTACATCAC TGAGAACGGT ATAGCTGATG AGCATGATAA GTGGAGGTCA 
TGGTTCATAG TATCGCACCT GTATCAAATT CACAGGGCCA TGGAGGAGGG GGTGGATGTT 
AGAGGGTACT TCCACTGGAA CCTAATAGAT AACTTGGAGT GGGCTGCAGG ATATAGGATG 
AGGTTCGGCC TAGTTTACGT TGACTATGCA ACCAAGAGGA GGTATTTTAG GCCAAGCGCC 
CTGGTTATGA GGGAGGTGGC TAAACAGAAG GCTATACCGG ATTACTTAGA GCATTACATT 
AAACCACCTA GAATTGAATG A

Protein sequence

MIKFPSDFRF GFSTVGTQHE MGTPGSEFVS DWYVWLHDPE NIASGLVSGD LPEHGPGYWD 
LYKQDHSIAR DLGLDAAWIT IEWARVFPKP TFDVKVKVDE DDGGNVVDVE VNESALEELR 
RLADLNAVNH YRGILSDWKE RGGLLVINLY HWAMPTWLHD PIAVRKNGPD RAPSGWLDKR 
SVIEFTKFAA FIAHELGDLA DMWYTMNEPG VVITEGYLYV KSGFPPGYLD LNSLATAGKH 
LIEAHARAYD AIKAYSRKPV GLVYSFADYQ PLRQGDEEAV KEAKGLDYSF FDAPIKGELM 
GVTRDDLKGR LDWIGVNYYT RAVLRRRQDA GRASVAVVDG FGYSCEPGGV SNDRRPCSDF 
GWEIYPEGVY NVLMDLWRRY RMPMYITENG IADEHDKWRS WFIVSHLYQI HRAMEEGVDV 
RGYFHWNLID NLEWAAGYRM RFGLVYVDYA TKRRYFRPSA LVMREVAKQK AIPDYLEHYI 
KPPRIE