Gene Cmaq_0979 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_0979
Symbol
ID	5710224
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	-
Start bp	1029221
End bp	1030762
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	46%
IMG OID	641275480
Product	aldehyde dehydrogenase
Protein accession	YP_001540801
Protein GI	159041549
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTGAGG TTAAGGGTAA AGTTAAGGTT GAGGTTAAGT CGCCTGAACT ATCATCAATA 
CTGAAGACTG GGCCTGATGG TACACCACTG TTCCCAACAT TCATTAATGG GCAATGGTAC 
ATGGGTGATA ATTGGCAGGA CGTCAAGTCC CCAATAGACT TATCTGTAAT AGCCAAGGTA 
CCGAGACTAC CAGGCAACGT AACTGAGCAG GCTATCGAAA CCACCTATAG GGAGGGTAGG 
TGGGCTATAA GGGACATGCC TGGTCAAAGG AGACTCGATG CATTTCATAG GGCGGCTGAC 
CTACTTGATA AGTTTAGGGA GGACTTCGTT AATGTACTAG TCTCCAACGC TGGTAAAACA 
ACCTCAGCGG CTAATGGGGA GGTTAATTCA GCAATTGAGA GACTGAGGAG ACTGGATTTT 
GATGTTGAAG GGGTTCACGG TGACTACGTG CCAGGGGACT GGAGTTTTGA TGCCTTGGAG 
AGCGAGGCCA TAGTTAAGAG GGAACCCATT GGGGTTGTGT TAGCCATAGT ACCATTCAAT 
TACCCACTCT TCGACACTGT TAATAAAATA GCATACTCAG CAATAGCTGG TAATGCCGTC 
TTAATTAAAC CAGCCTCAGC TGACCCATTA CCAACAATAC TCTTCGCCAG GGTACTTGAG 
CTAGCTGGAT TCCCAGTTAA GGCACTTGCA GTATTAACAA TACCAGGTAG GGACATGGGC 
AAGGTGGTTT CAGACAGGAG GATAGGGGCA ATTTCATTAA CTGGAAGCAC TGAGACCGGT 
ATTGAGGTTA TTAGGGAGGC TGGCATTAAG CAGTTTGTAA TGGAGCTTGG TGGCGGTGAC 
CCAGCCATAG TGCTTAATGA TGCTGACCCC AAGTGGGCTG CCCAAAGAAT AGCCATAGGC 
ATATACAGTT ACGCTGGGCA AAGGTGTGAT GCAGTTAAGT TCATTTTCGC TGAACCAAAC 
GTATATGATC AACTTAAGGC AAGCCTAATT GAGGAGTTAT CTAAGGTTAA GGTCGGTGAC 
CCAAGAAGCC CAGACACAAC AATGGGTCCA TTAATAGATG AGGCCACGGC TGACGAAGTC 
ATTAAGGCGG CTCAAGACGC AGTCTCCAAG GGTGGTAGAA TACTTTACGG TGGTAGGAAA 
CTCGGCCCCA CTTACATTGA ACCCACTTTA ATTGAGATTG ATAAGAGTAA GGTTAAGGAC 
CTGTACCTCT ACAATAAGGA GGTCTTCGCA GCCATAGCAG TGTTAGTGAA GGTTAATGAC 
TTAGATGAGG CCATTGAATT ATCTAATGGT AGGAGGTATG GACTTGATGC AGCAATATTC 
AGTAATGATG TAAGTAGGAT AAGGAAGGCA GCTAGGCTAC TTGAGGTTGG GGCAGTGTAC 
GTGAATGATT ACCCAAGACA CGGTATAGGC TACTACCCAT TTGGAGGCAG GAAGGATTCA 
GGTATTGGGA GGGAGGGACT TGGCTACACC CTTGAGTATG TTACGGCATA TAAGGCAATT 
GTATACAATT ATAGAGGTAA GGGTGTCTGG AGGTACTCGT GA

Protein sequence

MIEVKGKVKV EVKSPELSSI LKTGPDGTPL FPTFINGQWY MGDNWQDVKS PIDLSVIAKV 
PRLPGNVTEQ AIETTYREGR WAIRDMPGQR RLDAFHRAAD LLDKFREDFV NVLVSNAGKT 
TSAANGEVNS AIERLRRLDF DVEGVHGDYV PGDWSFDALE SEAIVKREPI GVVLAIVPFN 
YPLFDTVNKI AYSAIAGNAV LIKPASADPL PTILFARVLE LAGFPVKALA VLTIPGRDMG 
KVVSDRRIGA ISLTGSTETG IEVIREAGIK QFVMELGGGD PAIVLNDADP KWAAQRIAIG 
IYSYAGQRCD AVKFIFAEPN VYDQLKASLI EELSKVKVGD PRSPDTTMGP LIDEATADEV 
IKAAQDAVSK GGRILYGGRK LGPTYIEPTL IEIDKSKVKD LYLYNKEVFA AIAVLVKVND 
LDEAIELSNG RRYGLDAAIF SNDVSRIRKA ARLLEVGAVY VNDYPRHGIG YYPFGGRKDS 
GIGREGLGYT LEYVTAYKAI VYNYRGKGVW RYS