Gene Cmaq_1049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_1049
Symbol
ID	5710089
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	-
Start bp	1099685
End bp	1100635
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	42%
IMG OID	641275549
Product	protein of unknown function RIO1
Protein accession	YP_001540868
Protein GI	159041616
COG category	[T] Signal transduction mechanisms
COG ID	[COG0478] RIO-like serine/threonine protein kinase fused to N-terminal HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.290796
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.00000000362034
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGAGCATAA GTAACGTAAT AGCCTCCTAC AATGAGTTAA GTAAACTCGA CTTAAGGGTG 
CTTAGGGTAA TTGAGGTCCT CCACAGGAAT CACGAGTACG TTCCGGTTAA GAGGATTGTG 
AATTACATGG GTTTAAGTGA GGAGGTTATT GATAAGTCTA TTTCAAAGAT GAATAAGCTT 
AAACTACTGG TTAGGAGGGG GCCTGATAAC GTTAGGTTAA CATTCCCAGC CTACGACATA 
CTGTCAATAC ACACCATGGT TAAGAAGGGT GTTATAGATG CCATAGCCCC AACACCCCTT 
GGTGTTGGTA AGGAATCAGA CGTATACGCT GCTGATGCGC CAAATGGGGA AAAATACGCC 
TTAAAGTTCC ATAGGATTGG TAGAGTTAGT TTCAGGAATA CTAGGAAGTA TAGGGTTTGG 
ATTGGGGAGA GGAGGCATGT TACTTGGCTT TACGAAGCTA AGATATCAGC ACACATGGAG 
TACCTAGCGT TAACCGAAGC CTATAAGGCT AAGGTACCTG CACCAAGGCC TAGGGCTGTG 
ACAAGGCACT TGGTGGCCAT GGAGTACGTT AATGGTGTTG AATTATTTAG GGTTAAGTTA 
AGTAATCCTG AGGATGTTCT TGAACAGATT ATTTCAGCCA TTGAGGATCT CCTGAGGATA 
AACATTATTC ACGGTGACTT AAACGAATAC AATATCCTAG TTAATCCAAG TGATGAGAAA 
ATAACAATAA TAGATTGGCC CCAGTGGATG TACGCTAACG TTAAGGGATC TAGGGTAATC 
CTAATGAGGG ACCTCAACAT TATACTGAGG CACTTTAAGT CAAACTACGG GTTAAACGTA 
GGCATTGATG CAGTTATGAG TAGGCTAGCC CCATTAATAC CGAACAGTGA ATTACCACCT 
GAGAAGGCGT ACTCCAGGTT AATTAAGAGA GTAACATCCT TAGTTAAATG A

Protein sequence

MSISNVIASY NELSKLDLRV LRVIEVLHRN HEYVPVKRIV NYMGLSEEVI DKSISKMNKL 
KLLVRRGPDN VRLTFPAYDI LSIHTMVKKG VIDAIAPTPL GVGKESDVYA ADAPNGEKYA 
LKFHRIGRVS FRNTRKYRVW IGERRHVTWL YEAKISAHME YLALTEAYKA KVPAPRPRAV 
TRHLVAMEYV NGVELFRVKL SNPEDVLEQI ISAIEDLLRI NIIHGDLNEY NILVNPSDEK 
ITIIDWPQWM YANVKGSRVI LMRDLNIILR HFKSNYGLNV GIDAVMSRLA PLIPNSELPP 
EKAYSRLIKR VTSLVK