Gene Ssol_1991 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1991
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	1785285
End bp	1787030
Gene Length	1746 bp
Protein Length	581 aa
Translation table	11
GC content	35%
IMG OID
Product	NADH/Ubiquinone/plastoquinone (complex I)
Protein accession	ACX92201
Protein GI	261602598
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.366997
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACACGC TACTCTATAC ATTACCCCCA TTTCTAATTT CTATTATATT CTCAATCTTT 
AATAAAAAAG CGGGATATAT CTTGACAATG ATATCATCAA TAATACTACT TATCACCTCG 
ATTTACGAAT ATAATGGAGT TCTCTCATTC TTCTCCATAA TTTCTACCTC AGTGTGGATT 
CTTGCCTCAA TTTTCTCAAT AGAGTACGAT CATTACGGGA AATGGCTCTC CCCCTTATAC 
ATACTAACAA TCTTAGGCAT GACCATTGTC TTAAACTCTG ATGGTTATCT GTTATTCCTC 
GCAGGATGGG AAATAATGAC AATCCCAGCA TATGTAGCAA TAGGTCTAAC AGCAAAGAAT 
AATAGACCAC CATTCGTTTT CATGGCATTT GGAGAGCTGA GTACAGTTCT CATTTTAGCG 
GGATTTATAA TAGCAAACAC TACAAACTTC AATTACTTGC CATCTCCAGT TCCCTTGATT 
GTCGCTACTT TTGGATTCAT AATAAAAATG GGAATGATGC CTTTCCTTGT ATCGGAATGG 
CTACCTATAG CACATGGAAC AGCACCATCA AACTTTTCTG CAATACTAAG TGCCACAATG 
ACGCTAATGG GGGTTTACGG AATACTAAAA ATTACAATTT TAACACAAAC TATTCCGATT 
GGATTTTCAC TTACAATAAT GGCCATAGGT GCATTTAGCA TATTCTTTGG AGCACTTTAC 
GGATACGTAA ATGAGAACAC TAAGGGAATT TTAGCCTTTA GTACAATAGA AAATAACGGG 
GCAATACTAG TAGCCTTAAG TCTATACATG ATCTCAAAGC AACTAAACAT TACCTCAATA 
GAGCACATTT CCTTAATCAC TGTAATTTTA TACTCATTCG CACACTCAGT AGCCAAAACT 
GGACTATTCC TCTCTTCTGG CTTACAAGAA AAACAGAGCA TAACTTATTC AAAAAAGATA 
AGAAACATTG AAATAGGACT AACCCTATTG GCTTCCTCCA TGTCTGGACT ATTGCCGAAT 
ATAGGGGGAG TAGCATCTTG GCTATTACTT GAAAACCTAT TCATGTTCTC ATACGTACTT 
CATAACATGA TATCTATCCT CTTCATAATG ACTGGAGCAA TTATCGCAAT GGGAGAAGGT 
CTAGCAACAG CCTTATTAAT TAGATACATA ACGTATACAT CAATATTTCA GAATACAAGA 
GAACAATTAA GTAAAATAAA GAAATATCCC ATCTTATTAT CTGCACTTAT AGTACTCATA 
CTGGGATTCA CGTTACCTTA TTTGATATAC CCTTATAAAA ACTCTACAAC AATTCTAGGA 
ATGCTAACCA ATAGCGTGAT TCTAACACAA TACTATAACA CCACATTCGG AGGAATATCG 
CCACTCTACA TAATTTTACT ATTAGTAGCC TTCTCTATTG TAAGCTATCT CGCCTTTGGA 
AAGCCTAAAA TAAGAAAAGC AGAAACGTGG AACAATGGGG TAAACGAGAA AGAAGAATAC 
ACAGCATTTG CAATGGCAAA TAACATAAGA CAAATGCTAA AGAAAATCTT AAGGCCAGAA 
GAAGAGAAAT TCTTACCTAC ATACGGTTTA GATGTATTCT GGGAATACCT CTACAAACTA 
GCAAATTCAA TAAGAAGATT TGGGAAGATT TTCGCTAAAA CACTTATCAA CAGCTCAATC 
TCATGGTACA TTATATACAT TATTTTGACG CTCATTGTAG TAATAATAGT AGTTGTAATG 
GGGTGA

Protein sequence

MNTLLYTLPP FLISIIFSIF NKKAGYILTM ISSIILLITS IYEYNGVLSF FSIISTSVWI 
LASIFSIEYD HYGKWLSPLY ILTILGMTIV LNSDGYLLFL AGWEIMTIPA YVAIGLTAKN 
NRPPFVFMAF GELSTVLILA GFIIANTTNF NYLPSPVPLI VATFGFIIKM GMMPFLVSEW 
LPIAHGTAPS NFSAILSATM TLMGVYGILK ITILTQTIPI GFSLTIMAIG AFSIFFGALY 
GYVNENTKGI LAFSTIENNG AILVALSLYM ISKQLNITSI EHISLITVIL YSFAHSVAKT 
GLFLSSGLQE KQSITYSKKI RNIEIGLTLL ASSMSGLLPN IGGVASWLLL ENLFMFSYVL 
HNMISILFIM TGAIIAMGEG LATALLIRYI TYTSIFQNTR EQLSKIKKYP ILLSALIVLI 
LGFTLPYLIY PYKNSTTILG MLTNSVILTQ YYNTTFGGIS PLYIILLLVA FSIVSYLAFG 
KPKIRKAETW NNGVNEKEEY TAFAMANNIR QMLKKILRPE EEKFLPTYGL DVFWEYLYKL 
ANSIRRFGKI FAKTLINSSI SWYIIYIILT LIVVIIVVVM G