Gene Hore_22050 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_22050
Symbol
ID	7313753
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	+
Start bp	2401261
End bp	2402406
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	41%
IMG OID	643612657
Product	aminotransferase class V
Protein accession	YP_002509945
Protein GI	220933037
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1104] Cysteine sulfinate desulfinase/cysteine desulfurase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	0.718227
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGAAA TATATCTGGA TAACAGTGCT ACAACCCGTC CCCTCCCTGA AGTAGTGTCT 
CAAGTTGAGG AAGTATTGAC AACAAACTAC GGAAATCCCT CTTCACTACA TAATAAAGGC 
CTTTCCGCTG AAAAAATTTT AAAAGAAGCC AGGCAGACCA TTGCCGGAAA ATTAAACGTT 
AAACCAGATG AAATTATTTT TACATCCGGT GGTACTGAAA GTAACAACCT GGCTCTTAAA 
GGGACTGCCT ATCTATATAA AAACCGGGGG CGACACTTGA TTACTACCAA AATAGAACAC 
GCTTCGGTTA TTGATACCTT CAAAGCTCTG GAAGATGAAG GCTTTGAAGT CACCTATCTA 
AAACCCGATA AAAGGGGCAT AATCTCCTTA GAAGAACTTA AAAGGTCAAT AAGAGATGAT 
ACCATCCTGA TAAGTATTAT GCATATTAAT AATGAACTGG GAAGTCTACA ACCCATTGCT 
GAGGCCGGAT CCATTATTAA AGATATCAAT AAAAAAACCA TTTTTCACGT TGATGCCGTC 
CAGTCATTTG GTAAAGTGCT AATAAAACCT GCTGACTGGA ATATTGACCT TCTAACAATA 
AGTGCCCATA AAGTTCATGG CCCCAAGGGA GTAGGCGCCC TCTATAAACG GAAAAACCTT 
GACATAAAGC CCCTGTTAAA CGGGGGAGGT CAGGAAGATG GCCTGAGGTC CGGAACGGAA 
AACATCCCCG GGATTGCCGG TTTTATTCCT GCTGTAAAGG CCCTTCCAGA CTTTAATGAA 
AGGAATACCT TTAACCGGAA ACTGGACAGG CTTAAAAATC ATTTAATAGA TATGATTAAA 
GAAAAACTAC CTGATGTAAG GCTAAATACC CCGGAACAAT CGGCCCCCCA TATCGTCAAT 
ATCTCCATCC CTCGAGTAAA GGGAGAGGTA GTTGTTCACA GCCTTGAAGC AAAAGGTATA 
TATGTATCAA CCGGTTCAGC CTGTCATTCC CGGGAAAGAG AAAAAAGCCA TGTCTTAAGG 
GCCATTGGAC TACCTTCTGA ACTAATAGAT GGTACAATAA GAATCAGTCT GTCTGAATAT 
AACACAGAAA CAGACTTAAA CACTGCAGTA AAAACCCTGG CAGAACAGTT GCGGTATTTC 
TTTTAA

Protein sequence

MKEIYLDNSA TTRPLPEVVS QVEEVLTTNY GNPSSLHNKG LSAEKILKEA RQTIAGKLNV 
KPDEIIFTSG GTESNNLALK GTAYLYKNRG RHLITTKIEH ASVIDTFKAL EDEGFEVTYL 
KPDKRGIISL EELKRSIRDD TILISIMHIN NELGSLQPIA EAGSIIKDIN KKTIFHVDAV 
QSFGKVLIKP ADWNIDLLTI SAHKVHGPKG VGALYKRKNL DIKPLLNGGG QEDGLRSGTE 
NIPGIAGFIP AVKALPDFNE RNTFNRKLDR LKNHLIDMIK EKLPDVRLNT PEQSAPHIVN 
ISIPRVKGEV VVHSLEAKGI YVSTGSACHS REREKSHVLR AIGLPSELID GTIRISLSEY 
NTETDLNTAV KTLAEQLRYF F