Gene Hore_08880 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_08880
Symbol
ID	7314878
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	+
Start bp	956038
End bp	957216
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	41%
IMG OID	643611321
Product	aminotransferase class V
Protein accession	YP_002508639
Protein GI	220931731
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1104] Cysteine sulfinate desulfinase/cysteine desulfurase and related enzymes
TIGRFAM ID	[TIGR03402] cysteine desulfurase NifS

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	2.80371e-16
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAATA TCTATTTAGA TAATGCTGCA ACCACACCGG TTGCACCTGA AGTTATTAAA 
GTTATGGAAC CCTATTTTAA TATATACTAC GGAAATCCCT CAAGTGTCCA CACCCCTGGG 
CAGGATGCTG CCAGAGCTGT AAGTGAAGCC CGGGAGAAAG TTGCAGAATT AATTGGAGCA 
AGAGATGAAA GGGAGATAAT TTTTACCAGT GGTGGTACTG AAGCCGATAA CCTGGCCATA 
AAAGGAGTGG CTATGTCTTT ACAGGACAGG GGTAAACACA TTATAACCTC AAGTGTCGAA 
CACCATGCCG TTCTTCATAC CTGTGAATAT CTGGAGAAAT ACCTTGGTTT TGATGTAACC 
TATTTACCTG TTGATGAAAA AGGGTTTGTA GACCCTTCTA AGGTGGAAGA GGCTATAAGA 
GAAGATACGA TTTTGATATC AATTATGTTG GCGAACAATG AGATTGGGAC CATTCAGCCA 
GTTAAAGAGA TCGCTAAAAT AGCCAATGAA CATGATATTT ATTTCCATAC TGATGCTGTT 
CAGGCTATCG GTCAGATACC GGTAGATGTA GAAAAACTGG GAGTTGATTT ATTATCTCTA 
TCCGGTCATA AGTTTAATGG TCCTAAAGGG GTAGGAGCCC TGTATATAAG AAAGGGTGTT 
AAATTAGCAC CCCAGATGTC CGGGGGTGCT CAGGAAAGGA GAAGGAGAGC TGGAACGGAG 
AATGTTCCCG GCATTGTTGG TCTGGGTAAA GCTGCTGAAA TGGCTGCACA TAACCTGGAA 
GAAAAACGTC TTAAGCTGAA AAAACTTCGT GATAAATTAA TAAACGGCAT TGAAAATGAA 
ATTGATGAAG TATATTTAAA TGGTCCCCGG GGGGAAGATA GGCTTCCCAA TAATGTTAAT 
TTCTGTTTTA GGTATATTGA AGGGGAATCG ATTCTATTAA ATCTCGATAT GATGGGGATT 
GCGGGATCAA GTGGTTCTGC CTGTACTTCA GGTTCTCTGG ATCCTTCCCA TGTTTTACTG 
GCTATAGGTA GGCCTCATGA GATTGCCCAT GGCTCTTTAA GATTAACCCT GGGATATAAC 
AATACCGAAG AAGAAGTTGA TTATGTTCTT GAAGTATTAC CGGGGATTAT AAAAAAATTA 
AGGGCTATGT CTCCATTGTT TGATTCAGCT TCTGAGTAA

Protein sequence

MKNIYLDNAA TTPVAPEVIK VMEPYFNIYY GNPSSVHTPG QDAARAVSEA REKVAELIGA 
RDEREIIFTS GGTEADNLAI KGVAMSLQDR GKHIITSSVE HHAVLHTCEY LEKYLGFDVT 
YLPVDEKGFV DPSKVEEAIR EDTILISIML ANNEIGTIQP VKEIAKIANE HDIYFHTDAV 
QAIGQIPVDV EKLGVDLLSL SGHKFNGPKG VGALYIRKGV KLAPQMSGGA QERRRRAGTE 
NVPGIVGLGK AAEMAAHNLE EKRLKLKKLR DKLINGIENE IDEVYLNGPR GEDRLPNNVN 
FCFRYIEGES ILLNLDMMGI AGSSGSACTS GSLDPSHVLL AIGRPHEIAH GSLRLTLGYN 
NTEEEVDYVL EVLPGIIKKL RAMSPLFDSA SE