Gene Cmaq_0171 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_0171
Symbol
ID	5709029
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	+
Start bp	201167
End bp	202513
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	43%
IMG OID	641274674
Product	Alpha-amylase
Protein accession	YP_001540010
Protein GI	159040758
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1449] Alpha-amylase/alpha-mannosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.400898
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.121411
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTAAAA ACATCGTATT CTTCATGGAG ATGCATCAAC CTAGGAGACT TAATAGGCTT 
CTTCATTATC AATCCTCAAT GGAACCCCTT GACCTTTTAT TCGATGATGA ACTTGATAAG 
CTTATTTTAA GTAGGATTGC AGCTAGATCC TACAGTAAGG TTCTTGATAT TATTAAGGAG 
GCTAATAGGG AATACGGCTA CAGGTTTGCG ATTAGTATAA CTGGGGTATT GGTTGAACAG 
TTGAGGAAAT GGGCCCCGGA GGTTTTAGGG AAGTTAATTA ACTTAATTAA TGATGATGCC 
GCTGAGCCAG TGGCTGAAAC CTATTACCAC TCCTTAGCTT ACTTAATTGA TGAAGCTGAA 
TTCAGGGAGC AGGTTATGAT GCATGTTAAT TTAATTGAGA AGTTAACCGG GAAGAGACCT 
GTTACTGTGC AGAATACTGA ATTCATGTAT AGTGATGATG TTGGTAGGGT GTTTTCAGAA 
ATGGGGTTTA AGGTAGCCTT AACCGAGGGT GTGGAGAGGG TTCTTGGGTT TAGGCAGCCA 
ACTTACCTTT ACAAGAGCCC AAGCGGCTTA CTGCTCCTGC TTAGGCATTA TAGGCTTTCC 
GATGATGTTG GTTTCAGGTT TACGAATAAG TCATGGGACC AGTACCCGTT AACTGCCGAT 
AAGTACGTTG CTTGGTTAAG GGCGACATGG GGTGATTTAG TAATGATTGG GTTAGACATG 
GAGACCTTCG GTGAACACAT GCCTGAGGAG TCGGGAATAT TTGAGTTCCT GAGGTGGATG 
TTTAGGCATG CTTATGAATC AGGCATAAGG TTCATAGCGC CAAGTGAGGT TAAGGGGTAC 
GTGTCATCAT CATATGAACT TAACGTTAAT GAAGTAATAT CGTGGGCTGA TGCTGAGAAG 
GATACCTCAG CGTGGATTGG CAATGAAATG CAGTGGACGT CGTTTAACCA AGTGGCTATG 
CTTCACGGTT TAGTTAAGGA GCTTGGTGAT GAGTATCTGA GGAATTACGT TAGGTTACTC 
ATGGTTAGTG ACCACTTCTA CTACATGTCA ACTAAACATG GTGCACCTCA GGATGTTCAC 
AATTACTTTA ACCCATACTA CAGCCCCTAT AGAGCCTTTA CCCTGCATCA ATCCGCGGTG 
CATAGGGTAC TTAGCTACAT GGCTAGGACG CATGGTAATG CCTCAGTTAT TAGGCATTTA 
GCCAGGATTA AACTACCCAG TGAGTTAGCT ACCTGGGTTA GGGGTGAGTC ATTTAGTAAG 
GCTCAATGCA CCAATGCCCA ATACACGGCT AGGCTTATGA CTATTAATCA CCCTAAGTTA 
ACTGAAGCCT GCAGTAAATC AAGCTAA

Protein sequence

MVKNIVFFME MHQPRRLNRL LHYQSSMEPL DLLFDDELDK LILSRIAARS YSKVLDIIKE 
ANREYGYRFA ISITGVLVEQ LRKWAPEVLG KLINLINDDA AEPVAETYYH SLAYLIDEAE 
FREQVMMHVN LIEKLTGKRP VTVQNTEFMY SDDVGRVFSE MGFKVALTEG VERVLGFRQP 
TYLYKSPSGL LLLLRHYRLS DDVGFRFTNK SWDQYPLTAD KYVAWLRATW GDLVMIGLDM 
ETFGEHMPEE SGIFEFLRWM FRHAYESGIR FIAPSEVKGY VSSSYELNVN EVISWADAEK 
DTSAWIGNEM QWTSFNQVAM LHGLVKELGD EYLRNYVRLL MVSDHFYYMS TKHGAPQDVH 
NYFNPYYSPY RAFTLHQSAV HRVLSYMART HGNASVIRHL ARIKLPSELA TWVRGESFSK 
AQCTNAQYTA RLMTINHPKL TEACSKSS