Gene Cmaq_1941 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_1941
Symbol
ID	5709676
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	-
Start bp	2017398
End bp	2018588
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	46%
IMG OID	641276449
Product	acetyl-CoA acetyltransferase
Protein accession	YP_001541748
Protein GI	159042496
COG category	[I] Lipid transport and metabolism
COG ID	[COG0183] Acetyl-CoA acetyltransferase
TIGRFAM ID	[TIGR01930] acetyl-CoA acetyltransferases

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.545101
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTAATG AAGTTGTGAT AGTGGGGTAT GTGAGGACCC CCATAGGTAA GTTCGGTGGT 
TCACTTAAGA GTGTTAAATC ACCTCACTTG GCTGCTGAGT CGATAAGGGC ATTATTAAGG 
AGGACTAAGG TTGATTCAAG TATGATTGAT GAGGTTATAT TCGGCTCAAC ATTACAGGGT 
GGGATGGGGC AGAATATTTC CCGCTACGCA GCATTACTGG CTGGTTTACC GAATTCAGTC 
AGTGCCTATA CGGTTAATAG GGTTTGTTCA TCAGGTATGC AGGCAATTAT TGATGCTTAC 
AGGGAATTAG TGCTTGGTGA TGCATCACTT ATTATTGCTG GGGGTGTTGA CTCAATGAGT 
ACTCAACCAA TAGCATTACC CAGCGAGTAT AGGTGGGGTG TTAAGCACTT CATAGCTAAG 
ACTATTCAAC CAATAGACCT AATGGTTTAC GATGGTTTAA TAGATCCAGT AACAATGATG 
ATTATGGGGC AGGAGGCTGA CTTAGTGGCT AAGGAGAATG AGTTAACTAG GGATGAGTTA 
GATAATTACG CCTACATGAG CCACATGAGG GCTGTTAAGG CCACTGAGGG TAAGTTATTC 
AAGGAGATTG AGCCAATAGA CACAACAATA GAGGGTGAGA GGGTTAAGCT TGATCACGAT 
GAGGGAATAA GGCCTGATAC AAGCCTAGAG AAGCTTAAGG CCCTTAAACC AGCCTTCACC 
CCAAATGGAT TCCACACAGC CGGTAACTCA TCGCAGTTGA GCGACGGGGC TGCGGCATTA 
TTATTAACAA CAATGGATAA GGCCAAGGAA ATGGGGTTAA GGCCAGTGGC TAAGATACTT 
GGTTACGCAT GGTACATGAT TGAGCCAAGG AGGTTCACCG AGGCGCCGAC GTACGTTATA 
GATAAGGTAC TTAGGAAACT CAACCTAAGC ATTAACTCCG TTGACTACTT TGAGGTTAAT 
GAAGCCTTCG CAGTGGTTAA CGTACTGGTT AATAAGAGGC TTGGTGTACC GTACGATAAG 
ATGAACATAT TCGGTGGCGC AATAGCCATC GGCCACCCCC TAGGCGCCAG TGGGGCTAGG 
ATAGTGACTA CCCTGTTAAC CGGCCTTGAG CACACTGGTG GTAGAATCGG TGTTGCTGCC 
CTATGCCACG GCACTGGGGG AGCCACTGCA CTAGTTGTTG AGAGACTGTG A

Protein sequence

MSNEVVIVGY VRTPIGKFGG SLKSVKSPHL AAESIRALLR RTKVDSSMID EVIFGSTLQG 
GMGQNISRYA ALLAGLPNSV SAYTVNRVCS SGMQAIIDAY RELVLGDASL IIAGGVDSMS 
TQPIALPSEY RWGVKHFIAK TIQPIDLMVY DGLIDPVTMM IMGQEADLVA KENELTRDEL 
DNYAYMSHMR AVKATEGKLF KEIEPIDTTI EGERVKLDHD EGIRPDTSLE KLKALKPAFT 
PNGFHTAGNS SQLSDGAAAL LLTTMDKAKE MGLRPVAKIL GYAWYMIEPR RFTEAPTYVI 
DKVLRKLNLS INSVDYFEVN EAFAVVNVLV NKRLGVPYDK MNIFGGAIAI GHPLGASGAR 
IVTTLLTGLE HTGGRIGVAA LCHGTGGATA LVVERL