Gene Cmaq_1248 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_1248
Symbol
ID	5709400
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	-
Start bp	1318073
End bp	1319395
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	43%
IMG OID	641275753
Product	hypothetical protein
Protein accession	YP_001541065
Protein GI	159041813
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.00466791
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTGGAGTG GGGGCCGAAA TACCCTCACT ATGCCAGACG TGGGTACCAC TAGAACAGTG 
GTTGTTCGCC TTCTACCAAA TGATGTACAG GAGGGGGAAC TAGGACGATT AGCTAACGCC 
TCAACATCAC TTTTCAACGA AGTGAATTAC GAAAGAAGAC GGCGATTCTT CAACAAGCAG 
AAGATGGATT TCAAAGGAAC GTATAAGAAA TACTACGAGA AGTACAAGGG AATACTAAAG 
GTGAATGCAC AAGCAGTTAT TCAAAAGAAT AATGAAGCGT GGTCATCATT CTTCTCTCTC 
CTGAAGAAGG GTGAGAAAGC CTCCCCACCA GGCTATTGGA AAAGAGGAGG GGGAAGAGTG 
TTAATCCTTG TTGTGAGACA GGATAGGTAC TACGTGGATG TTGAGAACCA CAAGCTAGTG 
TTGAGGGACT TTAAACTAGA GATTCCCTTC GCCGGGAGAG TGAGGTGGTT TGGTAAACAA 
GGTAGGCTAG AGATTCATTA CGATGATACT CGGAACAGGT GGTATGCATA TATTCCAGTT 
GAGGTTGGTG TTACAACAAC ACGGACTGGA AAAGAGAGTA AGTTCATAGT TAAAGGGGAA 
AGGAAAGGGA TTCAGCTTTA TCAACCGAAA GGAAATAAGG TGGCGTCTGC TGACCTAGGC 
ATAAACATTC TAGCTAGTGT TGTTGTGAAT GATGGTACTT GGATTCTCTA TAAGAGTAGA 
GCTAAGGAGG ATTACTTCTA TTTTCAGAGG AGGATAGCTG AGGTACAATC AATAGTAGGC 
AAGGCTAAGA ATGCTGGTGA GCTAGAGGCT TATGAGGAAG CAAGAAGAGA GGAAGGAAGA 
TTATATGGAA AGTTGTACCG TCGCCTTCTC CATCTGTATA GGAGCTTCGC ATCTCATCTA 
ATGAAGACGT TGTACGAGAT GGGTGTGTCA ACCCTCATTG TTGGGTATCC TTACCTCATT 
GCACAAGATA AAGGTAACAA GTTCACAGTG AATATGTGGT CTTACTCAAA ACTATTTGAG 
GCTATTCTGT TGAAAGCCCA AGAGTACGGT ATTAAGGTCA TGAAGGTTGT GGAGTATAAC 
ACATCTAGAG TATGCGCCTT TCACGATGTT GAAGTTGTGA GGAAACCTAG GGGAGTAATT 
TCATGTCCAC ATGGTCATAA ACTACACGCA GACTTAAATG GAGCATTAAA CATCATGAAA 
CTAGGAGTAG GAATAGTCAT AAACGAAGTG AAAAACCCCC TCTCCTTCTT TATTGATCAT 
AACCAAGTAG CCCCCACAAA GGGGGGTAAC ACCCAAGACC CCAACGAAAC CCCCACCCTT 
TAA

Protein sequence

MWSGGRNTLT MPDVGTTRTV VVRLLPNDVQ EGELGRLANA STSLFNEVNY ERRRRFFNKQ 
KMDFKGTYKK YYEKYKGILK VNAQAVIQKN NEAWSSFFSL LKKGEKASPP GYWKRGGGRV 
LILVVRQDRY YVDVENHKLV LRDFKLEIPF AGRVRWFGKQ GRLEIHYDDT RNRWYAYIPV 
EVGVTTTRTG KESKFIVKGE RKGIQLYQPK GNKVASADLG INILASVVVN DGTWILYKSR 
AKEDYFYFQR RIAEVQSIVG KAKNAGELEA YEEARREEGR LYGKLYRRLL HLYRSFASHL 
MKTLYEMGVS TLIVGYPYLI AQDKGNKFTV NMWSYSKLFE AILLKAQEYG IKVMKVVEYN 
TSRVCAFHDV EVVRKPRGVI SCPHGHKLHA DLNGALNIMK LGVGIVINEV KNPLSFFIDH 
NQVAPTKGGN TQDPNETPTL