Gene Hore_15420 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_15420
Symbol
ID	7313139
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	-
Start bp	1649744
End bp	1651129
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	47%
IMG OID	643611988
Product	hypothetical protein
Protein accession	YP_002509286
Protein GI	220932378
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.000000364962
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATAAAA TCAAGGTGCT TTCTCCAACT GCTATACTGG GGTATGGTTT TCCAGTAGAG 
TCTTTTGAAA GGGGGCTGGA CCGGAAGCCA GATGTCATTG CGGTCGATGG TGGCTCCACC 
GACCCCGGAC CTTATTATCT GGGGTCAGGC CTTTCCTTTA CAGACCGCAA CGCCGTAAAG 
AGGGATTTGC ACTTAATGAT AGAGGCCGGT CAAAAGCTAA ATATACCCGT ACTGGTTGGT 
ACGGCCGGGG GTTCCGGAGC CAGTGCCCAT CTGAACTGGT GTCTCGATAT TGTAAAGGAG 
ATAATAAATG AAGAGGGCTT TAAGCTTAAA ATAGCCACCA TTGGGGCTGA GATTGACCGG 
GAAGAGGTTA AAAACAGGTT AAGGGAAGGG AAACTATCTC CCCTCTATCC CGCTGAAGAG 
GTTAATGAAG AAGAAATTGA CAGGGCCACG AGAATTGTGG GGCAGATGGG TATTGAACCT 
ATTATTGAGG CTCTCAAGGG TGGAGCTGAC CTGATATTGG CCGGGCGGGC CTATGACCCC 
ACTGTCTTTG CCGCCTACCC TATCCTGAAG GGTTTTGAAC GAGGTCTGGC TCTACATATG 
GGTAAAATCC TGGAATGTGC CAGTATTGCT GCTGACCCGG GAAGTGGGAG TGATTGTATG 
CTGGGGATAC TGGGGCAGGA TCACTTTATA CTTGAGCCCC TGAACCCGGA GAGAAGGTGT 
ACGGTGACTT CGGTTTCAGC TCATACCCTG TATGAAAAGA GCAACCCCTA TAAACTTTAC 
GGTCCCGGTG GGGTTATCGA TTTGACAGAG ACTGAATTTG AACAGATAGA TGAGAGGCGG 
GTTAAGGTTA CCGGTAGTAA ATTTATCCCT GATGAAGATT ATACTATAAA GCTTGAAGGG 
GCAAAGCTTG TTGGATACCG GACTATATCT ATTGCTGGAA CCAGGGATCC CATTATGATA 
CGCCAGATAG ATGATATCTT AAAAGAAGTA AAAAGGATAG TTAACGAAAG TTTCAGTGAG 
GACCGGGAAA AATATAATAT TTATTTCAGG GTATATGGTA AAAACGGGGT TATGGGGAAA 
CTGGAACCGG TCCAGGAGAT AACCGCCCAT GAACTCGGTA TTGTTATTGA AGTTATTGCC 
GATACCCAGA AACGGGCCAA CAGTATCTGT AGTTTTACCA GATCGACCTT GCTCCATTAT 
GGTTATCCAG GACGGGTGGC TACAGCCGGT AACCTGGCTT TCCCTTATTC ACCTTCAGAT 
ATTAAGGCTG GTGAAGTCTA TGAATTTAAC CTTCACCACC TGGTGCAGGT CGATGATCCC 
CTTGAGTATT TCCCTGTCAG GTTTATGACA GAGGATACTA TTCCAGAAGA CGGGAGGTTA 
ACATAA

Protein sequence

MDKIKVLSPT AILGYGFPVE SFERGLDRKP DVIAVDGGST DPGPYYLGSG LSFTDRNAVK 
RDLHLMIEAG QKLNIPVLVG TAGGSGASAH LNWCLDIVKE IINEEGFKLK IATIGAEIDR 
EEVKNRLREG KLSPLYPAEE VNEEEIDRAT RIVGQMGIEP IIEALKGGAD LILAGRAYDP 
TVFAAYPILK GFERGLALHM GKILECASIA ADPGSGSDCM LGILGQDHFI LEPLNPERRC 
TVTSVSAHTL YEKSNPYKLY GPGGVIDLTE TEFEQIDERR VKVTGSKFIP DEDYTIKLEG 
AKLVGYRTIS IAGTRDPIMI RQIDDILKEV KRIVNESFSE DREKYNIYFR VYGKNGVMGK 
LEPVQEITAH ELGIVIEVIA DTQKRANSIC SFTRSTLLHY GYPGRVATAG NLAFPYSPSD 
IKAGEVYEFN LHHLVQVDDP LEYFPVRFMT EDTIPEDGRL T