Gene Cmaq_0109 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_0109
Symbol
ID	5709461
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	-
Start bp	133817
End bp	135649
Gene Length	1833 bp
Protein Length	610 aa
Translation table	11
GC content	46%
IMG OID	641274615
Product	DNA topoisomerase type IA central domain-containing protein
Protein accession	YP_001539953
Protein GI	159040701
COG category	[L] Replication, recombination and repair
COG ID	[COG0550] Topoisomerase IA
TIGRFAM ID	[TIGR01057] DNA topoisomerase I, archaeal

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00000681889
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATAAGT TAATTGTTGC TGAAAAGAAC AGTGTGGCTA AGGCTATAGC CCAATACTTA 
GCTGAGGGTG GATACACATT AAGGAGAATT GGTATTGTAC CCGTCTACTT CTTTAAGGTT 
AATGGGGAGT ATTGGGCATC CATGGGCCTA AGGGGGCATA TCCTTGACTT CGACTTTGAA 
CACTCCTATA ATAATTGGAA CAGAGTGGAG CCGGGTAAGC TCCTTGACCT TGAGCCAGTA 
ATGGTGATTA GGGGTTGGGA TAGGCCGTAC GTAACGGCGT TGGTTGAATT ATCGAAGCAG 
GCTAGGGAAA TTATCCTCGC CCTAGACTCT GATGTTGAGG GTGAGGCAAT AGCCTACGAG 
GTAATGCTTG TGACTAGGCT TAGGAAACCC ACCTTAAGGT TTAGGAGGGC ATTATTCTCA 
GCGGTCACTA GGGATGATAT TAGGAGGGCA TTCAGTAAGT TAACAACAAT CAACGTTAAC 
CTTGCTAGGA AGGTCTTCAC CAGAATGGTT ATTGACCTTA AGTACGGTGC AACATTCACT 
AGGCTATTAA CCTTAAGCGC CAAGTCAAGT AAGGCGCCAT TAAATAGGGG TGAGTTCCTA 
AGCTACGGCC CCTGTCAAAC ACCGGTGCTT AACCTAGTTG TTCAAAGAGC CTTGGAGAGG 
GAGAATTTTA AGCCTGAGGT TTACTATAAG ATTAAATTAA TCATTGAGGC TAACGGTGAG 
TTAATTGAAT TAGAGTCCAT TGATAAGTTT AAGAACCTTA AGGAGGCCCA GGAGGCGCTT 
AGTAGGGTTA AGGCAGGTAA GGCGGTGGTT AAGAATATTG AGGCTAAGAG GGTTCACGTT 
AATCCACCTA AGCCCCTTGA AACCGTGGAG CTTGAGAGGA GGGCTAGTAG ATTCCTCAAC 
ATTAGGAGTA AGCAGACCCT TGATGCAGCA GAGGAGCTTT ACAGGCAGGG TTACATATCC 
TACCCAAGAA CTGAAACCAA CATTTACCCA CCCACCCTGG ATTTAAGGGG TATTTTAAGG 
AACCTAACCT CAACGTCAAC CTACGGTCAA TACGCAAGGC ATCTACTGGC TGGTGAATTA 
AGGCCTACTG CAGGTAAGGA TAATGATAAC GCCCACCCGC CAATACACCC GGTTAAGGCT 
GCTGATAAGC CTGAGTTAAT GGCTAGGTTC AGGGACTTTA AGTACTGGCT CATATACGAC 
CTGGTGGTTA GGCATTTCCT AGCAACCCTA AGTCCCCCAG CCTTAATTGA GGAGCAGAGG 
CTTACTGTTG ATGCTGGTGG AGTACTCTTC GAGGCTTCAG GCCTCAGGAT CATTAATGAC 
GGCTACTTCA CGATTTACCC CTTCGAGAGA CCTAGGGCTA ATCCACTACC CTTAAGCGCA 
TTAAGGATTG GTATGCAGGT CACTGTTAAG GATGCTAAGG TTGTTAAGAG GAAGACCACG 
CCGCCACCCT ACTTAAGTGA ATCAGAGTTG CTTAGGTTAA TGAGGAAGTA CGGTATAGGT 
ACAGACGCCA CTATGCAGGA CCACATACAT ACTAACGTTA AGAGAAGGTA CTTCAAGATA 
ATTAAGGGGC AGTGTGTACC CACACCGCTT GGTAAAGCGT TAATAACCTC ATTATCCAAG 
TACGCACCAA CGTTAATAGA CCCAAACTTC AGGAGTAGGA TGGAGTCCAT GCTTTCACTC 
ATTGGTTCAG GGAAGGAGAT GCCTGACTCA GTGAGGAGGA GGCTTGAGGA GGAGGCCGCT 
AGGGTTTACA CCTCAATGAA GCCTAATTCT AATCAACTCG GGGAAGAATT AGCTAAGGCG 
TTGAGAAGCA TGGTTAATGA AAAGGGCGCT TAA

Protein sequence

MDKLIVAEKN SVAKAIAQYL AEGGYTLRRI GIVPVYFFKV NGEYWASMGL RGHILDFDFE 
HSYNNWNRVE PGKLLDLEPV MVIRGWDRPY VTALVELSKQ AREIILALDS DVEGEAIAYE 
VMLVTRLRKP TLRFRRALFS AVTRDDIRRA FSKLTTINVN LARKVFTRMV IDLKYGATFT 
RLLTLSAKSS KAPLNRGEFL SYGPCQTPVL NLVVQRALER ENFKPEVYYK IKLIIEANGE 
LIELESIDKF KNLKEAQEAL SRVKAGKAVV KNIEAKRVHV NPPKPLETVE LERRASRFLN 
IRSKQTLDAA EELYRQGYIS YPRTETNIYP PTLDLRGILR NLTSTSTYGQ YARHLLAGEL 
RPTAGKDNDN AHPPIHPVKA ADKPELMARF RDFKYWLIYD LVVRHFLATL SPPALIEEQR 
LTVDAGGVLF EASGLRIIND GYFTIYPFER PRANPLPLSA LRIGMQVTVK DAKVVKRKTT 
PPPYLSESEL LRLMRKYGIG TDATMQDHIH TNVKRRYFKI IKGQCVPTPL GKALITSLSK 
YAPTLIDPNF RSRMESMLSL IGSGKEMPDS VRRRLEEEAA RVYTSMKPNS NQLGEELAKA 
LRSMVNEKGA