Gene Hore_02070 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_02070
Symbol
ID	7312526
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	+
Start bp	213196
End bp	214350
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	41%
IMG OID	643610629
Product	Stage II sporulation E family protein
Protein accession	YP_002507963
Protein GI	220931055
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	69
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGGATGA AAGTTGATGT TGGAGTTGCC AGCCTTTCAA AACACGGTGA AGAGGTCTGT 
GGTGATAGTT ATCAGGTCAT CAGGTCTAGG GATGCGACAA CAGTAATTTT ATCTGATGGT 
CTTGGTAGTG GGATCAAAGC CAGTATACTC TCGTTATTAT CTACGAAAAT TGCTTCAAGA 
TTACTGGAAA GAAATATCAA TGTAGAACAG GTTTTTGCCA CCATAGCAGA TACCCTCCCT 
ATCTGTCAGA CCAGGGAGAT AGCCTATTCA ACTCTGTCGA TTTTAAAAAT AACAGATAGT 
GGCTATGCCC ATTTAATTGA ATACGACAAT CCCTCCCTGA TATTGATTCG TAACGGGCAA 
AGGGTCAAAT TAGATAAAGA ACAAAAAATA ATCGCCGGTA AAAAAGTAAG TGAAGTCCAT 
TTTAAACTTA AACTGGGTGA TTTATTGCTT GTAGTTAGTG ATGGAGTCAT TAATGCCGGG 
GTTGGAGGGC TATTTCACCT GGGGCTGGGG CGAGAAAGAC TGGTAGAACA TGTTACCAAA 
TATGGATTAT ATAAAAAGGA TTCCCTTCAT GTTGCCCGGG ATATCATTGA ATTAACTGAA 
GCCTGTTATA TCTGTAAACC GGGTGATGAT TCGACATGTA TTGCTTTAAA ATTAAGAGAA 
CCCCGTTCTG TTGTGGTGTT AACGGGTCCT CCCACTGATC CAGATCTGGA TGGAAAGGTG 
GTTAAGGAGT TTCTTAAACG TAATAATTCA GAGAAAGTAG TCTGTGGCGG GGCGACCGGA 
AATATGGTGG CTCGGGAACT TGGTGAAGAT ATAGAAACAA GCTTAACCTA TGATGACCCC 
AGTGTTCCCC CCCTTGCTTC TATAAAGGGA ATTGATCTGG TGACAGAAGG CATATTAACC 
CTCAATAAAT GTCTGGAAAA GATTTTGCAG TTAAAAAAGG GACAGAGTAT TGATGAAAAA 
AAAGATGGGG CCAGCCTTTT AGCCAGGACA TTATTTAAGG CCGATCAAAT ACATTTTTTG 
GTAGGAACTG CTGTAAACCC CGCCCACCAG GAATTAATGC AGTCCTTACA GTTAAAGCCC 
AGGCCGGTAA TAGTTAATAA ACTGATAAAA GAGCTTGCTG AACTGGGTAA AGAGATAAAG 
ATAAAGAGGT ATTAA

Protein sequence

MGMKVDVGVA SLSKHGEEVC GDSYQVIRSR DATTVILSDG LGSGIKASIL SLLSTKIASR 
LLERNINVEQ VFATIADTLP ICQTREIAYS TLSILKITDS GYAHLIEYDN PSLILIRNGQ 
RVKLDKEQKI IAGKKVSEVH FKLKLGDLLL VVSDGVINAG VGGLFHLGLG RERLVEHVTK 
YGLYKKDSLH VARDIIELTE ACYICKPGDD STCIALKLRE PRSVVVLTGP PTDPDLDGKV 
VKEFLKRNNS EKVVCGGATG NMVARELGED IETSLTYDDP SVPPLASIKG IDLVTEGILT 
LNKCLEKILQ LKKGQSIDEK KDGASLLART LFKADQIHFL VGTAVNPAHQ ELMQSLQLKP 
RPVIVNKLIK ELAELGKEIK IKRY