Gene Cmaq_1371 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_1371
Symbol
ID	5709866
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	-
Start bp	1444760
End bp	1446580
Gene Length	1821 bp
Protein Length	606 aa
Translation table	11
GC content	46%
IMG OID	641275881
Product	glycoside hydrolase family protein
Protein accession	YP_001541187
Protein GI	159041935
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1449] Alpha-amylase/alpha-mannosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGTCTACG TGAGGGCTTT ACTTGATGTT GATAGCCCAG TGCATAAGGT GGGGGATGAG 
GTTGGGGTTA AGGTTAGGTT GATTAATGAT TCATCATCAT CAATAAACGT TAACATAACC 
CTCGACTACC TACTGGAGGG TAGGCACGTT AACTCATGGA CTGGTTCAGC CCTAGCACTA 
CCCGGTGAGG TGACTACGGT TAACGCATCA TTTACCGTGG GTGAGGCTGG GCTTTGGGTT 
ATTAGGCTTA ATGGTGACGC GGGGACTAGT AAATTCACTG AGTCAATTAA GGTGAGGGTT 
ATTGAGGGGA GGAGGCCGGT TAAATTAGCC TTAGTGTACC ACATGCATCA ACCCCCATGG 
TACATGAGTG ACGGCAGGTA TTACGCTGAT TGGGCATTCA GGTACGTTCA TGCCCCGGTT 
ATGGCACCCT TCTTCAACGG TGGCCCATAC TTATTCCACG CATTCCTCAA TGACAAGTAC 
AGTGGAGTTA AGGTGAATAT TCACTTATCC CCAAGCCTAC TTAAGCAGTG GGTTGATGCC 
ATTGAGAAGG GTTATACCCT CATTAATGGT GAAGTCCACG CAAAGGGTAG TGGTGAGGTT 
AATGCGGTGG CTAAGGTCCT TGATATGTAT AGGGTTCAGG CTAATAGGGG GCAGTTGGAT 
GTATTATCAA GCGTATACGC CCACACCATA CTGGGTTACT TAGCATCAAG GTACGAGATT 
ATTGACGTTA TTGATGAGGA ACTGGGCGTG GGTATGGAGG TTACTAAAAG TACCCTGGGT 
GTTAATCCCG TTGGTGTTTG GACTCCTGAA ATGGCGTGGA GTATGGAGTT GCTTGACATA 
TATGAGAAGC ATAAGGTCGG CTACACTGTG CTTGATGGTG GTAATCACTT CCCTGGGGTT 
CAGGGGGATA AGGGGAGTAT TTATGAACCC TATAGCCTGG GTGGTAGGTT AACAGTATTC 
TTTAGGGATG AGAGGTTAAG TAACATTTTA TCCTTCCAGA ATAATATCCC TGACGAGAGG 
TCTGCGGTGA AGCTTGCCGC AATGCTCAGT AGATCCATTA TTGAGACTAA TGGTGAATTA 
GTGGTCATTG CCCTTGATGG TGAGAACTTC ATAGCCATGT CCAAGACCCC GGCCATGGTT 
GGTTTAATGC TTGATAAATT CTACTCATAC CTCAGTAGAA TGCAGGAGTT AGGCATTATT 
GAGACTGTTA GGCTTAGTCA AGTTAACATG AGTAGGAGAA GCATAACCTA CATACCCACA 
ACCTCCTGGT TAGGGGGCTT CACTAAGTGG GATGGAGAGA GGAGGGAGCA TGCAGAGTAC 
TGGGTTAAGG TCATTGACTC ATACAGGTAC TTGAGGGGTC TTGAGGATGC ATTGGGTGGT 
AAGATTAATG AGGCTAGGTA CGCCCTATGG CATGCCCTAG ACAGTGACTT CTGGTGGGCT 
GAGTTCTGGA ATCCTGATTT AATTAACCAT TGGGTTGAGG AGTTCCGCAA TATCCTGGAT 
TCAAGGTTCA AGATAGCCAT GAGGCCCCTA AGGGAGGTTT ACAGGGGGCT TGTTAATAGG 
CCTATTGATG TGGAATTAGA GTTTGATAAT GACATGGGGG TTAACGTTAA GTTCAAGTTA 
ATTTGCCTAG ATACTCAACT GGATGTTGTT ATTCAGCCTG GTTCCTCAAG GATTAAGTGC 
AGTATAATAC CTAGGTTAGC CGGTTCCTAT AGGGTACCCA TATTCGTAAC CTCAGGTAAC 
TACATTTACC TACAATCCTA CGTAACCCTA AACGTCACCT ACGGTAATAG GGATCCACCT 
AATGAGGATT CAGCGGGATA G

Protein sequence

MVYVRALLDV DSPVHKVGDE VGVKVRLIND SSSSINVNIT LDYLLEGRHV NSWTGSALAL 
PGEVTTVNAS FTVGEAGLWV IRLNGDAGTS KFTESIKVRV IEGRRPVKLA LVYHMHQPPW 
YMSDGRYYAD WAFRYVHAPV MAPFFNGGPY LFHAFLNDKY SGVKVNIHLS PSLLKQWVDA 
IEKGYTLING EVHAKGSGEV NAVAKVLDMY RVQANRGQLD VLSSVYAHTI LGYLASRYEI 
IDVIDEELGV GMEVTKSTLG VNPVGVWTPE MAWSMELLDI YEKHKVGYTV LDGGNHFPGV 
QGDKGSIYEP YSLGGRLTVF FRDERLSNIL SFQNNIPDER SAVKLAAMLS RSIIETNGEL 
VVIALDGENF IAMSKTPAMV GLMLDKFYSY LSRMQELGII ETVRLSQVNM SRRSITYIPT 
TSWLGGFTKW DGERREHAEY WVKVIDSYRY LRGLEDALGG KINEARYALW HALDSDFWWA 
EFWNPDLINH WVEEFRNILD SRFKIAMRPL REVYRGLVNR PIDVELEFDN DMGVNVKFKL 
ICLDTQLDVV IQPGSSRIKC SIIPRLAGSY RVPIFVTSGN YIYLQSYVTL NVTYGNRDPP 
NEDSAG