Gene Cmaq_1304 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_1304
Symbol
ID	5708911
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	+
Start bp	1378099
End bp	1379169
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	48%
IMG OID	641275811
Product	alcohol dehydrogenase
Protein accession	YP_001541121
Protein GI	159041869
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.19327
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	0.319474
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTCGAAT ACCTAACGCT AATGAAGGCG GTAACAGTTA TTCCCAGTGT CCCGGAGTCC 
TTAAGATTAA GAGATGTTGA TAAGCCTAAA CCTAATCATG GTCAAGTACT ACTTAAGCCG 
ATTAGGGTTG GGATATGTGG TACAGATAAG GAGATTATTG AAGGCAAGTA CGGTAAGGCA 
CCACCGGGTA GTCAATACCT GATACTTGGT CATGAGGCGT TAGCGGTCGT GGAGGAGCTT 
GGGGATGGTG TGGATAATGT GGCTGTGGGC GATGTCGTGG TACCAACGGT TAGGAGACCC 
CTTGACTGCA ACCTACCCGT TGACTACTGT CCAATGGGGC ATTACGTGGA GCATGGTATA 
TGGGGGCTTC ATGGGCATGC AGCCGAATAC TCAGTAACAG ACGCCAAGTA CCTTGTTAAG 
GTACCCAAGG AGTTAATTGA TGTGGCCGTA TTAACAGAGC CATTAAGCGT AGTTGAGAAG 
GGTATTGATG TGGCGCTTAG CGTAGGTGGT TCAAGGTTCG AGTGGAGGCC TAGGAGTGCG 
TTAATACTTG GGGCTGGGCC AATAGGCCTA CTCTCAACAA TGGTTCTTAG ATTAATGGGC 
CTATTAACAA CCACCGTAGC CACTAGGCCT CCTGATAGTC TTAAGGCTAG GTTGGTTAGG 
GAATTGGGGG GAGTTTACGT GGATTCTGCA TTAAGCAGCA TAGAGGGTGT CTTTGACCTA 
GTGGTGGAGG CAACAGGATC CCCCCAGGTC ATGGTGGATG GTTTAAGGCA CCTAGCCCCT 
AATGGAGTAA TGGTGCTCCT CGGGGTTTAC CCACCTGGTG GGGTTATTAA TGACTTAGGT 
AATGTGTTAA CGGACTCAGT CCTTAATAAT AAGGTTTTAG TTGGATCAGT GAATGCTGGT 
GTTAAGCACT TTGAATTAGG CTTAAGGCAT ATGGCTGAGG CTAAGGGTAG GTTTGGTGAC 
TGGCTTAGTA GATTAATCAC GAAGAGGGCT ACCCTTGATA ATTACCAGGA AGCCTACTCC 
TGGACCCATG ACGACATTAA GACCGTCCTT GAAATAAACC CACTTAATTA A

Protein sequence

MVEYLTLMKA VTVIPSVPES LRLRDVDKPK PNHGQVLLKP IRVGICGTDK EIIEGKYGKA 
PPGSQYLILG HEALAVVEEL GDGVDNVAVG DVVVPTVRRP LDCNLPVDYC PMGHYVEHGI 
WGLHGHAAEY SVTDAKYLVK VPKELIDVAV LTEPLSVVEK GIDVALSVGG SRFEWRPRSA 
LILGAGPIGL LSTMVLRLMG LLTTTVATRP PDSLKARLVR ELGGVYVDSA LSSIEGVFDL 
VVEATGSPQV MVDGLRHLAP NGVMVLLGVY PPGGVINDLG NVLTDSVLNN KVLVGSVNAG 
VKHFELGLRH MAEAKGRFGD WLSRLITKRA TLDNYQEAYS WTHDDIKTVL EINPLN