Gene Hore_20010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_20010
Symbol
ID	7312816
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	+
Start bp	2157082
End bp	2158410
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	40%
IMG OID	643612447
Product	Cysteine desulfurase
Protein accession	YP_002509743
Protein GI	220932835
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0000000000584034
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACACTT ATAAAAAATG GAGAGGGCAG GTTGTTGGTG TTAACAAAAA GGTCCCCCTC 
AGTAATAACA GGCTTTCCAC CTATGTTAAT TTTGATAACG CGGCCACAAC CCCACCATTT 
AAATCGGTAA TAGAGCGGAT TACTGAATTT GCAGGCTGGT ATTCCTCCAT TCACCGGGGA 
AAAGGCTATA AATCAAGATT ATGTTCTACA ATTTATGAAG AGGCCCGCGG GGATATTCTT 
AATTTCGTTA AGGCTGATCC CGATTATTAT ACCCCTATCT ATGTTAAAAA CACCACCGAA 
GCAATTAATA AACTGGCCTA TACCCTGGGT CAGGATACTG ATAATAGAAA TATTATAATT 
ACAACCTCAA TGGAACACCA TTCCAACGAT TTACCCTGGA GAAAATACTT TAAGGTAGAA 
TACATAAAGC TGAACGAAAA GGGGCAACTA TCTCTTGATG ACCTTGAATC AAAACTAATA 
AAACACCGGG GCAAGGTAAG ACTGGTTACC GTTGGTGGGG CCTCTAATGT AACCGGTTAT 
CTCAACCCGA TTTATCAAAT TGCCGGCCTT GCCCATAAGT ACGGGACTGA AGTAATGATC 
GATGGAGCCC AGTTGATTCC CCACCACCCT GTCGAAATGA GTCCAAAAAA AGCGGGAGAA 
AGACTAGATT ACCTTGCCTT TTCAGGACAT AAAATGTATG CCCCTTTTGG AACGGGAGTC 
CTTATAGCCC CTCAAAAAAC CTTTGCATCA AATACTCCAG ACCAGGTCGG TGGGGGAACA 
GTTGATATAG TAACCCCTGA TTTTGTGAGG TGGCATACCC CCCCACATAA AGAAGAAGCT 
GGCTCTCCCA ATTTAATGGG GATAGTAGCC CTGACTGAAG CCATTAAAAT TTTAAATGAA 
TTCGGAATGG AGTCGATTTT GAATCACGAA AAACGGCTGA CTGATTATAC CCTGAAAAGA 
TTAAATAAAA TACCTGATGT CATCCTTTAT GGAAATAAAT TTAATAGTAA GGATAGATTA 
GGAATTATCC CTTTTAATAT TGACGGGTTA TCCCATGAAT CAATAGCCAC TATACTGGCC 
GGTGAAGGTG GTATCGCCGT AAGAAATGGC TGCTTTTGTG CCCAGCCCTA TGTCCAGCAG 
CTCCTCAATA TATCTGAACA GGAAATACGG GCCAGAATAA ACAATCCTGA CCTACCCCAT 
CCCGGTCTGA TAAGAATTAG TTTTGGACTA TACAATACAT TTCAGGAGAT TGATAGGTTA 
ATAGATATGG TTAAAGTAAT AGTCTCAAAT AAAGAGTATT ATTACAGAAA AACAAAAATT 
AATTTTTAA

Protein sequence

MNTYKKWRGQ VVGVNKKVPL SNNRLSTYVN FDNAATTPPF KSVIERITEF AGWYSSIHRG 
KGYKSRLCST IYEEARGDIL NFVKADPDYY TPIYVKNTTE AINKLAYTLG QDTDNRNIII 
TTSMEHHSND LPWRKYFKVE YIKLNEKGQL SLDDLESKLI KHRGKVRLVT VGGASNVTGY 
LNPIYQIAGL AHKYGTEVMI DGAQLIPHHP VEMSPKKAGE RLDYLAFSGH KMYAPFGTGV 
LIAPQKTFAS NTPDQVGGGT VDIVTPDFVR WHTPPHKEEA GSPNLMGIVA LTEAIKILNE 
FGMESILNHE KRLTDYTLKR LNKIPDVILY GNKFNSKDRL GIIPFNIDGL SHESIATILA 
GEGGIAVRNG CFCAQPYVQQ LLNISEQEIR ARINNPDLPH PGLIRISFGL YNTFQEIDRL 
IDMVKVIVSN KEYYYRKTKI NF