Gene Ssol_1967 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1967
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	1752255
End bp	1753520
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	35%
IMG OID
Product	Nucleotidyl transferase
Protein accession	ACX92178
Protein GI	261602575
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.270118
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAAAGT GGGATATATC AGATGTAAAA GTTATAATTC CCATAGGGGG TGAGGCTACT 
AGACTAAGAC CCTTAACAAT AGAAACATCT AAAGCAGCTG TTAGATTACT TAATAGACCG 
CTTATTGAAT ATACAATTTT AGAGTTAGCT AAACAAGGTA TTAAGGAATT TATCTTTGGT 
GTAAAAGGGT ATGTAAATTA TAGGTCTTTG TTTGACTTAT TCAAGGAGGG TATTGGTTTT 
TCGGCAAGAT ACAAGATTAA GCCAAGAGTT CACTTTAAGT ATCAACCGAG AGTAGATAGT 
ATAGGTAACG CTGACTCTGT AAGAATAAAT ATTGAATATT ATGACATTAA TGAACCAATT 
GTAGTAGTGC AAGGCGATAA TATATTCAAA TTAGATATAA CGAAAGCATT GGAATTTCAT 
GAATCCAAAA GTTCGCTTAT GACCATAGTG CTAAAGAAGT ATGAAGGAGA CTTAAGCGAA 
TTTGGCGTAG CTGATACCAC TGGAGATTTA GCAATAAGAA AATTTGTTGA GAAGCCAAAA 
AGAAGAGAGG ACGCACCATC AGATTTAATA AATACTGGGA TTTACATCTT GTCCCCTGAA 
ATAAGAAAGA TATTCAAGAG TAATGACGTG AAGGAAATGT ACAAAATGGG CAAAATGGAT 
TTTGGAAAGG ATATAATTCC ATACTTGATA AATAAAGGTT ATCCAGTTTA CGGATATCCC 
ATGAAGGAAA TATGGTTTGA TATAGGTACT CCAGAGCGTT ATTTGGACGC AATGGTTACG 
CTACTGCACA CATTGTCAGA TTCTGAAATA GGTGGAATAA GAATAGATCC TAATAGACGT 
ATATTTGTAC AAGGAACAAG CCCAGACTCA AGGAAGAGAA GAAGAGAGAT ACAGAGAAAA 
TTCAAGAAAG GACTCATAAA GATTGAGGGC GATGCACTTA TCGGTAGGCA TTGTCAAATA 
GGTGACGATA CATATATAGA GGAGTCTAAT ATAGACAATT TTACAATGAT TGGGAAGGGT 
GTAAAGATAG TAAGAAGTGC AATTATGGAT AGAGGCTATA TTGGAGATAA TGTGCATATT 
GAAAATTCGA TAATAGCTAG GCACGTCGAG ATAAGGTCAA ATAATGAGAA GCCAGTTAGA 
ATAATAAATA GTGTAATTGC TGACGATGTA ATAGTAGGAG AAGGTACCGA GATTATAAAT 
TCCAGAATTT ACCCACACAA GTTTATAAAT GCCGGGAGTA GAATTCATGA TACAATATTG 
ACATGA

Protein sequence

MTKWDISDVK VIIPIGGEAT RLRPLTIETS KAAVRLLNRP LIEYTILELA KQGIKEFIFG 
VKGYVNYRSL FDLFKEGIGF SARYKIKPRV HFKYQPRVDS IGNADSVRIN IEYYDINEPI 
VVVQGDNIFK LDITKALEFH ESKSSLMTIV LKKYEGDLSE FGVADTTGDL AIRKFVEKPK 
RREDAPSDLI NTGIYILSPE IRKIFKSNDV KEMYKMGKMD FGKDIIPYLI NKGYPVYGYP 
MKEIWFDIGT PERYLDAMVT LLHTLSDSEI GGIRIDPNRR IFVQGTSPDS RKRRREIQRK 
FKKGLIKIEG DALIGRHCQI GDDTYIEESN IDNFTMIGKG VKIVRSAIMD RGYIGDNVHI 
ENSIIARHVE IRSNNEKPVR IINSVIADDV IVGEGTEIIN SRIYPHKFIN AGSRIHDTIL 
T