Gene Cmaq_0073 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_0073
Symbol
ID	5709386
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	-
Start bp	86231
End bp	87637
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	43%
IMG OID	641274576
Product	aldehyde dehydrogenase
Protein accession	YP_001539917
Protein GI	159040665
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGCGTC AAATCCCAGT ATATGAACCA GCGACCGGTG AGGTTTTAGC CTATGTACCG 
GACATGAGTA TTAATGAAGT TAGGGATGCA ATAAGTAAGG CATATGACGC ATTACCCAGG 
ATACAGTCGA TACCGGCCTA CGAGAGGGCT AAGCTACTAA TGAAGGTTGC TCAGGCTATT 
AGGGCACGTA AGGAGGAGTT AGCTAGGTTA CTAACAAGGG AGATTGGTAG ACCAATTAAG 
AGCACTAGGT TAATCCTCGA GAGGACGGCT AGGATTTATG AATTAGCAGC CCAGGAATTA 
CCCCATGTCT TAACCGGTGA ATTCATACCC CTTGAGGCTT ATGATTACCC GGCAGGTAAT 
GAGAAGAGAA TAGCCTTCAT TAGAAGGGAA CCAGTGGGTG TGGTGGGTGC TATAACACCC 
TTTAATTTTC CACCAGACAG TATGGCTCAT AAGGTTGCCC CAGCCTTGGC AATAGGTAAT 
ACTGTGGTTC TTAAGCCGAG TAGGAATTCA CCATTAACGG AAACTGAGAT AGCTAAGATA 
ATTACTGAGG TGGGGTTCCC TGAGGGTTCA ATTAACGTGG TTACTGGTGA TTCATCAATG 
ATTGGTGATG AATTCGTTAA TAACCCTAAG GTATCATTAA TAACGTTCAC TGGTTCATCT 
AAGGTTGGTC TTAATTTAGC CAGTAGGGCA ATATTAATGG GTAAGAGGGT TATTATGGAG 
CTTGGCGGTA GTGATGCAAT GATAATCCTG GAGGATGCAG ACTTAAATAA GGCTGTCCAA 
GCAGCCACAG TGGGTAGGTT TGATTACGCT GGGCAATTCT GCAATGCCAC CAAGAGGTTA 
ATAGTGAGGG ATGAGGTGTA TGATGAATTC ATTAAAAGGC TTACTGAGAG TGTTTCGAAA 
CTTAAGATAG GTGATCCATT AAGGGAGGAT ACTGATGTTG GTCCATTAAT AAGTAGGGAG 
GCTGTGGAGA CTATGGAGTT CTTCGTTAAT GATGCTTTAA GTAAGGGTGG GAGAATCATA 
TATAGGGTCA GTGGGGTTCC GGAAAGGGGG TTCTATTATC CACCAACAAT ACTGGAGGCT 
CCGTTTAACT CAGCGGTGTG GATTGAGGAG GTTTTCGGCC CAGTATTACC TGTTGCTAGG 
GTTAAGGATG ATGATGAGGC TGTTGAATTA GCCAATAGGA CTGAGTATGG GCTTGACGCA 
TCAATATTCA GTAGGAATTT CTCAAGGGCA TATAAGTTAG CCACTAGGAT TAAGGCAGGA 
ACCATATTCA TTAATGATAC CACTAGGCTC AGGTTTGATA ACCTACCCTT TGGTGGATTT 
AAGAAGTCTG GTATTGGACG TGAGAGTGTT AGGGATACTA TGATTGAGAT GAGTGAAGTT 
AAGGTTATAT CTTACACATT AGATTGA

Protein sequence

MQRQIPVYEP ATGEVLAYVP DMSINEVRDA ISKAYDALPR IQSIPAYERA KLLMKVAQAI 
RARKEELARL LTREIGRPIK STRLILERTA RIYELAAQEL PHVLTGEFIP LEAYDYPAGN 
EKRIAFIRRE PVGVVGAITP FNFPPDSMAH KVAPALAIGN TVVLKPSRNS PLTETEIAKI 
ITEVGFPEGS INVVTGDSSM IGDEFVNNPK VSLITFTGSS KVGLNLASRA ILMGKRVIME 
LGGSDAMIIL EDADLNKAVQ AATVGRFDYA GQFCNATKRL IVRDEVYDEF IKRLTESVSK 
LKIGDPLRED TDVGPLISRE AVETMEFFVN DALSKGGRII YRVSGVPERG FYYPPTILEA 
PFNSAVWIEE VFGPVLPVAR VKDDDEAVEL ANRTEYGLDA SIFSRNFSRA YKLATRIKAG 
TIFINDTTRL RFDNLPFGGF KKSGIGRESV RDTMIEMSEV KVISYTLD