Gene Ssol_2043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_2043
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	1832029
End bp	1833120
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	51%
IMG OID
Product	transposase IS4 family protein
Protein accession	ACX92251
Protein GI	261602648
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.547441
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACATG AGAATACAAC TAAACCGGCG AAGTTCAACC GGGACTTCGC CAGGTCCGCC 
CTCAAGATAA TTTACTCGAT CCTCACTAAA ATACTTTTCC CTGAGGAACT CCTCAGTGCC 
TTGCTTAAGG CGAGTGGGAG CTACTTGAGC AGGTTGGGAA AAGATGGGAG AAGAGCGTTG 
AGAAAGTTGA ACGCGGTTCA AGTTGAGGAC GTGAGGGATG CGTTGAGGAA GATGGGGAGG 
ATGACGTTAA GGGGAGTCAG GGACAGGAGG GTAGCAGTGG ACTTCCATGC CATACCTCAA 
TACCACGCTG ACAAGAGTTT CTTGAGTAGG ATAAAGCCAA CTAAGGGGAC GTCGTGGGGA 
CTGGTTCAAG CTGCGATCTT CCTCCTGGGG AGGACGAGGA GCTTCTTGGA CGTGATCCCA 
GTGACCGTGA AGAACGTAGC TGAAGGTTTC AAGGCGGTGA TGGAGGTAAT CGTGAAGGAG 
TTGGAGGAGG ACAAGCTGAG GCTCGTCATG GTCTTCGCGG ACAGGGAGTT CGCGGTGAAC 
GAAGTGATTA GGTTCCTCTT GGAGTTGGGC TTGGACTTCG TCATATCTGC CAAGGCCCAG 
ATGTACAAGA AGTACAAGGG GATGTTGCAA GATGTGGATG TGAGTTTTGG CGGAGTTAGA 
TATACTGGAT TTCTCTGCGT GAGACATGGG AGTGGAGCTT ATCTCATTAT TCTGAGGAAG 
GAAGACGGCA AGATTATTGC CTTCCTCGTG AGGAGGGAGA TGGATCTTTA TGATGCCATA 
GTCCTTGCCG AGATGTACAG GGAGAGGTGG GGGATAGAGA ACGCCTTCCG CTCCCTTGAG 
GAGTTCAGAA TCAAGACTAG GACTTGTGAC GTGAGGAAGG AATTGGTTCT CGTTCTGCTT 
TCCTATCTTC TCTTGAATGT CTGGTTCTTG ATCCGCTCTT GGAGGAAGGT AAAGTTGTGG 
GAGTTCTCGG TCTCCCTCTC GAATCTCCTC GATCGGGAGG TAAGAGTGGA ACAAGAACGC 
GCGTTCCGTG AAGTGAAGAC GTCATTCCCC CAGACTCCAG CTAACCCTAT GCACCTCCTT 
CCAGCTACGT GA

Protein sequence

MKHENTTKPA KFNRDFARSA LKIIYSILTK ILFPEELLSA LLKASGSYLS RLGKDGRRAL 
RKLNAVQVED VRDALRKMGR MTLRGVRDRR VAVDFHAIPQ YHADKSFLSR IKPTKGTSWG 
LVQAAIFLLG RTRSFLDVIP VTVKNVAEGF KAVMEVIVKE LEEDKLRLVM VFADREFAVN 
EVIRFLLELG LDFVISAKAQ MYKKYKGMLQ DVDVSFGGVR YTGFLCVRHG SGAYLIILRK 
EDGKIIAFLV RREMDLYDAI VLAEMYRERW GIENAFRSLE EFRIKTRTCD VRKELVLVLL 
SYLLLNVWFL IRSWRKVKLW EFSVSLSNLL DREVRVEQER AFREVKTSFP QTPANPMHLL 
PAT