Gene Hore_04770 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_04770
Symbol
ID	7314456
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	-
Start bp	509880
End bp	511154
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	44%
IMG OID	643610900
Product	alpha/beta hydrolase fold protein
Protein accession	YP_002508230
Protein GI	220931322
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1506] Dipeptidyl aminopeptidases/acylaminoacyl-peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.00000317728
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCACTTT TAATTTTTTT ACTCTGCATA TCCCTGGTAT TCACCCACCA GGCTACAGCC 
CAGGAGACCA TCTCAGGAAC CTGGAAGGGA GCTATTAATG TCAAGGGGCA GACACTGGAC 
ATTACCATTC ATATTAAACC TGATAATAAT GGTGGTTACC TGGCTACCAT TGATATTCCC 
GCCCAGGGGG TTAAAAACTA TGCCCTGAAG AATGTAAAAT ATAATCACCC TGACCTCTAT 
ATGGAGCTAC CAGCTAATAT AACCGGTTTC TTCAATGGTA AAGTCAGTGG AGCCAGAATT 
AAAGGAAAAT ATACCCAGGG TTCAGCCCGG GGAACCTTTT ATCTAAATAA AAAGACAACC 
GATGAATCCG AAACCAGATC AAAAGATAAT GATACCGGGA CTGAACCCAT TAGCCTGAAA 
ACAGAGACCG GTACCATATA TGGTACCCTC CAGTTACCCC ATTCTAACAA AAAATCCCCG 
GTAATACTTA TAATTGCCGG TTCTGGAATA ACAGACCGGA ATGGTAATTC ACCTGGTGCT 
ACCAATAACT GCCTTAAGAT GCTAAGCCAG GACCTGGCCA GGGCCGGTTT TGCTTCTGTC 
AGGTATGATA AAAGGGGAAC CGGTCAGAGC AAAGGAGCCA TTAATAGCCC TTCTGACATC 
AGGTTTGAAC ACTTTATAAA TGACGCGACT GGCTGGGTTA AAAAATTGAA GAAAGATAAA 
AGATTTACCG GAGTAACTGT CTTAGGACTC AGCCAGGGGT CCCTGGTGGG AATGATCGCC 
GCCCGCCGCG CCGAGGCCGA TGCCTTTATA TCTCTGGCCG GAGCCGGTCG TTCCATTGAT 
AAGGTCTTAA AATATCAACT AATAAGCCTT AATGATGATC TATACCAGGA AGCCCTGGAT 
ATTCTGGATA AACTGAAACA GGGGCAGACG GTAAGCCAGG TCAACCAGAA ACTCTATTCT 
ATCTTTCATC CCTTAAACCA GCCTTTTCTT ATCTCCTATA TCAAATATGA CCCGGCTGAA 
GAGATAGCTA AACTTGATAT CCCGGTCCTT TTGATTCACG GAACAAATGA TATCCAGGTC 
AAAAAGGAAG AAGCTAATAT TCTTAAAAAA GCCTATCCAG AAGCAAAATT GGTCCTCATC 
GAGGGAATGA ACCATGTCCT GAAAAAAGCA CCGGAAGACC CCAGGCAAAA CTACATGACC 
TACAACAACC CTGATCTACC TCTGGCTGAT AACCTGGTCG AGAGTATTGT TAAGTTTCTT 
GAAAAGGTAT ATTAA

Protein sequence

MSLLIFLLCI SLVFTHQATA QETISGTWKG AINVKGQTLD ITIHIKPDNN GGYLATIDIP 
AQGVKNYALK NVKYNHPDLY MELPANITGF FNGKVSGARI KGKYTQGSAR GTFYLNKKTT 
DESETRSKDN DTGTEPISLK TETGTIYGTL QLPHSNKKSP VILIIAGSGI TDRNGNSPGA 
TNNCLKMLSQ DLARAGFASV RYDKRGTGQS KGAINSPSDI RFEHFINDAT GWVKKLKKDK 
RFTGVTVLGL SQGSLVGMIA ARRAEADAFI SLAGAGRSID KVLKYQLISL NDDLYQEALD 
ILDKLKQGQT VSQVNQKLYS IFHPLNQPFL ISYIKYDPAE EIAKLDIPVL LIHGTNDIQV 
KKEEANILKK AYPEAKLVLI EGMNHVLKKA PEDPRQNYMT YNNPDLPLAD NLVESIVKFL 
EKVY