Gene Ssol_2065 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_2065
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	1853456
End bp	1854598
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	36%
IMG OID
Product	von Willebrand factor type A
Protein accession	ACX92271
Protein GI	261602668
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCTTT CGTTAAGAGT AGATACAAGC CATAAGTACT CATTTAATGC AGATGTTAGG 
TATATCTTTA AGGTATTATT AGTTCCAGAG AAATTAGGCT CTGCAACTGG TTTCCACTAC 
ATAGTAGCCC TTGATACAAG CGGGTCTATG ACGGGATATA AAATAGAGTT AGCTAAACAA 
GGTGCCATAG AATTATTCAA AAGAATACCT AATGGCAATA AGGTTTCCTT CATCACTTTT 
TCATCAAATG TGAACGTGAT TAAGGAATTC GTTGATCCTT TAGACTTAAC GAATGAGATA 
TTGCAGATAA CAGCAGGAGG TCAAACGGCA CTATATACAG CGATCTTAAC TGCAAATAGT 
TTAGCTAAGA AGTATCAAAT GCCAACCTAT CTATTACTGT TAACTGACGG AAATCCCACA 
GATGAGACGA ATATTGGGAA TTATCTAAAG TTACCCTATT ATGAAAAAAT ACAGGTCTAT 
TCATTTGGAA TTGGTGACGA CTATAATGAA CAACTACTTC AAAGTGTTAG TGATAAGACG 
GGAGGGGTAA TGTATCATAT TTCAGATGCT AACGAAATAC CGCAAAAGCT TCCTCAAAAG 
GCTGTAACGC AAATAGCTGC AAAGAATGTT ACGGTTGATA TAACTGCTGA GGGTAACGTA 
AAACTTTTGA ATTATGTAAC AACACCAGTA AAAGTAAATG GGATAGAGAA CGTTATTAAA 
ATTTTTGGAG AAACCATTTT ACCAGCCAAT TATGAGGGTA ACTTCTTAAC TGTGAAAGTC 
AATTATGAAG ATCCGGTAAC TAATAAGCCA GAATCACTTT TGCAAGTTAT TCAAGTTAGG 
AAAGCACAAG ATCAAAATAC ATTTGTATCT GGCATAAACA ATGACGTGAT AAATGAATAT 
AGATACTATG AACTATTGGA TAAATACGCG AAACAAGTTC AAGCCGAACA ATTGGTTGAA 
GCTACGAAAA CTCTTAACCA ACTAAATGAA ATAGCCCAAC AGACCAGAAG AATAGACTTC 
ATGGAGACTA CTAGAAGGTT GTCTGAAGGT TTAGAGACCA CTAAAAGGAT AGGTACAGTT 
GAACAGACTA AGAGGTTATC AAAAGAGGTT ACTAGTGAGG TTACTAGAAA GCTTAGGGAA 
TGA

Protein sequence

MTLSLRVDTS HKYSFNADVR YIFKVLLVPE KLGSATGFHY IVALDTSGSM TGYKIELAKQ 
GAIELFKRIP NGNKVSFITF SSNVNVIKEF VDPLDLTNEI LQITAGGQTA LYTAILTANS 
LAKKYQMPTY LLLLTDGNPT DETNIGNYLK LPYYEKIQVY SFGIGDDYNE QLLQSVSDKT 
GGVMYHISDA NEIPQKLPQK AVTQIAAKNV TVDITAEGNV KLLNYVTTPV KVNGIENVIK 
IFGETILPAN YEGNFLTVKV NYEDPVTNKP ESLLQVIQVR KAQDQNTFVS GINNDVINEY 
RYYELLDKYA KQVQAEQLVE ATKTLNQLNE IAQQTRRIDF METTRRLSEG LETTKRIGTV 
EQTKRLSKEV TSEVTRKLRE