Gene Hore_21890 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_21890
Symbol
ID	7313737
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	-
Start bp	2380519
End bp	2381742
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	40%
IMG OID	643612642
Product	hypothetical protein
Protein accession	YP_002509930
Protein GI	220933022
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	54
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACGTT TTGCCATCTG GTTCCTTGTT TTAGTTGTAC TGGCAGCTGC AGTAAGTGCT 
GTTCATAAAA TATATGATTT AAGGTATCTT TATCGGATAT ATATTAAGAG AGAATTTGCG 
ATAAACCCTA AAGCAGAAAT CAGGCCTGAT AGAGTGTATA AGGTCAGGAT CTGGTATTAT 
CCCTATAAAC GGGTAATCAC AAAGGAAGGT AAGGATGAAA AAGAGTTTTT TAAAGAGGTA 
GCTAAAGAGG TGGAGAGGAA ATACCCCAAT ATACAACTAA AAATTGGCAG ACTTGATTTC 
AGGAAGGGGC GGGCTACCCT CGATAGGGCA CTCAAAGCAG GTGATCCCCC CGATATTTAT 
TTTAATTTTA GTAACCAGCC ATATATAACA AAAAAGTTAC AGGTGCCGGC CCATTTATAT 
CTGACCCGGG AGGATTATGA ACTTCTACCC CCTTTTATGG AGGAAGGCAG GCTATGGGGT 
TTTCCCTTCC TGATTGAGAG ACAGGTCTGG CTGGCCAGAA ACAACTTACC CGGTCTGGCA 
GAACCGGTCC TGACAATTAA TAGGTTTGAT GATTTGAAAG ATGATAGCTT AATATTAAAC 
TATTATGATC CCACCCTTTT ATTACAATTA TTATCACTCT ATGGTATTAG TGATATTGAA 
TATAACGGAA AGACCCTCGA CAATAAAACC CTGGAGGCCC TGAGAGCTGT TTTTAAACTG 
GCCCATAATT TAAGGCAGGC AAAGATATAC GGGAAAGCAG GTCAGGTTGA TATCACAATG 
TTGAAGAGTT TTTTTCAAGG TAAAACTGTC CTGCTGGGCC CGGTTAATCC CTGGCTAAAA 
GAAGTATTGT CCAATAGATT AAGTGATTCC ATTGTGGAAG TTAAGCTTGA TAACCTGGTC 
AGGGTTTATA CTCTGACCAT ATTTAGACAG GAACCTTATC GGGGGGATGA TCATACTAAA 
GCAGCAGTAG AGGTGGCGAG AATCATTGCT CAGAAAAAGG CTTACATAAT GGCCAGTGAT 
TTAGGCCTTA TCCCGGCCTT CAGAATGAAA AAGGAAGTAG AGCAATCAGG GGATATTTCT 
ATAGACAGGT ATAAACCTGT CATAACTTTA ACCCCTGAGG AAAGGGATTA CTGGTATAAA 
AACATTATTC CACTCTGGGT ACAGTTCTGG GAAGACAACT TAAGCCCTGA AGAAGCCCTG 
GCTACTATAA TAAAAAATAA TTAA

Protein sequence

MKRFAIWFLV LVVLAAAVSA VHKIYDLRYL YRIYIKREFA INPKAEIRPD RVYKVRIWYY 
PYKRVITKEG KDEKEFFKEV AKEVERKYPN IQLKIGRLDF RKGRATLDRA LKAGDPPDIY 
FNFSNQPYIT KKLQVPAHLY LTREDYELLP PFMEEGRLWG FPFLIERQVW LARNNLPGLA 
EPVLTINRFD DLKDDSLILN YYDPTLLLQL LSLYGISDIE YNGKTLDNKT LEALRAVFKL 
AHNLRQAKIY GKAGQVDITM LKSFFQGKTV LLGPVNPWLK EVLSNRLSDS IVEVKLDNLV 
RVYTLTIFRQ EPYRGDDHTK AAVEVARIIA QKKAYIMASD LGLIPAFRMK KEVEQSGDIS 
IDRYKPVITL TPEERDYWYK NIIPLWVQFW EDNLSPEEAL ATIIKNN