Gene Ssol_0034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_0034
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	30333
End bp	31463
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	35%
IMG OID
Product	aminotransferase class V
Protein accession	ACX90339
Protein GI	261600736
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.163206
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGATTAA GAGATCCGAG AGAATTTAGG GAAAACGTAC CCGTTACCAG AAAATACGTA 
TATTTAAATC ATGCATCAGT GTCACCCACA CCTTTACCGT CGTTATTTGA GGCTTACAGA 
TATTTATATG AAGTTGCAAA TAGGGGAAGC ATAGCTGTTA ATGAAGAGGA AGAGGATGAA 
CTGTATCACA TAAGGTCTAA AATATCCAAT TTGGTAGGAG CATACTCAGA TGAGATTTCG 
CTAATTCCAA ATACTAGTTA TGGGGTAAAC TTAGTTGCAC ATGGGCTAGA ATGGAAGGGA 
GATGATAATA TAGTAACAGA TAACCTTGAG TTCCCAACTG TAGTGTACCC ATTTTTGAAA 
TTAACGAAAA AAGGAGTCAA GATAAATATA GTAGAGACTA ATCCCTATAC CTTTGAGGAA 
GATATAATAT CACATATTGA TAAAAATACT AGATTAGTTG CAATAAGCCA TGTTAGCTTT 
AATACTGGTC TGAAAGTAGA TGTTAGAAAA ATTGTAAAAG CCGCAAGGGA GAACAATACT 
CTAGTTCTAT TAGATATCAT ACAGAGTGCT GGTGCAGTCA AAATAAATGT AAAGGAACTT 
GGTATAGATT TCGCTATTGC TGGAGGATAT AAATGGTTAA TGAGTCCACA AGGATCCGGA 
TTTATCTATG TTAAAAGAGG ATTGATAGAA GATCCACCGT TTTATGGATG GAAAACTAGT 
GCTGATTACT TGGATTTTAA TCCAAATAAG TTTACATTAG AGAAGGGTCC TAGAAGATTT 
GAAATAGGTA CAGTAGATTT AGCTGCAAAC TTATCACTTG CAAAGTCTTG CGAAATAATA 
GGCGAAAATA TGGAATTAAT TGAGAGTTCA GTGACGAATC TTTCCCAATT TGCAATAAGA 
TTAGCAAAGG ACCATAGCAT GGAGGTAATC ACTCCAGAGG ATAAGAGAGC TGGAATTGTC 
ATAGTAAAGG TTAAAAAACC TAAAGAGATA GCGAAGGAAC TATTAAAGGA AAACATAGTT 
GTGTCGCCAA GAGGAGAAGG GATAAGGATA TCAACGCACT TCTACAATAC AGAGGAGGAA 
GTTCAAAAGA CTATTGAGAA AATCTCAGAA CTCGAAAGAA AATTCAACTA G

Protein sequence

MRLRDPREFR ENVPVTRKYV YLNHASVSPT PLPSLFEAYR YLYEVANRGS IAVNEEEEDE 
LYHIRSKISN LVGAYSDEIS LIPNTSYGVN LVAHGLEWKG DDNIVTDNLE FPTVVYPFLK 
LTKKGVKINI VETNPYTFEE DIISHIDKNT RLVAISHVSF NTGLKVDVRK IVKAARENNT 
LVLLDIIQSA GAVKINVKEL GIDFAIAGGY KWLMSPQGSG FIYVKRGLIE DPPFYGWKTS 
ADYLDFNPNK FTLEKGPRRF EIGTVDLAAN LSLAKSCEII GENMELIESS VTNLSQFAIR 
LAKDHSMEVI TPEDKRAGIV IVKVKKPKEI AKELLKENIV VSPRGEGIRI STHFYNTEEE 
VQKTIEKISE LERKFN