Gene Cmaq_1416 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_1416
Symbol
ID	5709312
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	-
Start bp	1494760
End bp	1495836
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	46%
IMG OID	641275926
Product	radical SAM domain-containing protein
Protein accession	YP_001541231
Protein GI	159041979
COG category	[H] Coenzyme transport and metabolism [R] General function prediction only
COG ID	[COG1060] Thiamine biosynthesis enzyme ThiH and related uncharacterized enzymes
TIGRFAM ID	[TIGR00423] radical SAM domain protein, CofH subfamily

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.150894
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCAGG CATTGGAGAA GGCCCTTAGT GGTGAAGAGT TGAAGCCCCC TGATATTGAG 
GAGCTTCTTG AATTAAACCT ATGGGACCTA GGCATCGCTG CAGGGGAGTT AACTAGGAGG 
TTGTTTAATG GTGTGGTGAC CTTCATACCC AATCTAATAC TGAACTACAC CAACGTCTGC 
ACAATAGCCT GCAGCTTCTG CGCCTTCTAT AGGCCACCTA GGCACCCTGA GGCATACACC 
ATGAGTGTGG ATTACGCCGT TAAGCTTGTT ACAGAGGTTG ATTCAAGATT CGGTATTAGG 
CAGGTTCTAG TGCAGGGTGG TATTAATCCT GAATTAGGCA TTGAGTACTA CGAGGAATTA 
TTCAAGACCC TTAAGGCTAA GCTACCCCAC GTGGCTATTC ACGGTTTAAG CCCCATTGAG 
GTTGATTACC TAGCTAGGAA GCATAGAATG AGTTACAGGG AGGTTCTTGA GAGGCTTAAG 
GCAGCTGGAA TGGATACGCT AGCTGGGGGT GGCGGGGAGA TTCTGGTGGA TGAGGTTAGG 
AGGATTATTG CACCACATAA GATTAGTGCT GAAACCTGGT TGAGAGTAAT GGAGATTGCC 
CACGGGTTAG GCATAATGAG TAACGCAACA ATGATGTACG GGCACGTGGA GTCTAAGGCG 
CATTGGGCTG AGCACCTATA CAGGATTATT AGCCTACAGA GGAGGACTCA TGGATTCCTA 
TCCTTCACCG CGTGGAATTT CGAGCCAGGT AACAGTGAGT TAACTAATAA GGTTCCTTAC 
CCATTAACAT CAGCCACATT ACTGAGGGTG GTTGCCGTGG CTAGGCTTGT GTTTAAGGGT 
GAGTTACCTA ATATTCAATC AAGTTGGTTA ACTAATGGTC TTGATACTGC TCAATTAGCC 
CTCAAATTCG GTGCAAACGA CTTCGGTGGA ACACTATACG AGGAGAGAGT AATACCAGCA 
ACCGGGTTAA GTAAACCAGT ATTCACAAGG GATTACGTAA TCAACATGAT TAGAAGCCTA 
GGATACAAAC CAGCGGAACG CGACAACTGG TATAGGGTGT TAAAACTATA CGACTAA

Protein sequence

MSQALEKALS GEELKPPDIE ELLELNLWDL GIAAGELTRR LFNGVVTFIP NLILNYTNVC 
TIACSFCAFY RPPRHPEAYT MSVDYAVKLV TEVDSRFGIR QVLVQGGINP ELGIEYYEEL 
FKTLKAKLPH VAIHGLSPIE VDYLARKHRM SYREVLERLK AAGMDTLAGG GGEILVDEVR 
RIIAPHKISA ETWLRVMEIA HGLGIMSNAT MMYGHVESKA HWAEHLYRII SLQRRTHGFL 
SFTAWNFEPG NSELTNKVPY PLTSATLLRV VAVARLVFKG ELPNIQSSWL TNGLDTAQLA 
LKFGANDFGG TLYEERVIPA TGLSKPVFTR DYVINMIRSL GYKPAERDNW YRVLKLYD