Gene Hore_04020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_04020
Symbol
ID	7314077
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	+
Start bp	412184
End bp	413491
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	43%
IMG OID	643610826
Product	Exodeoxyribonuclease I subunit D
Protein accession	YP_002508156
Protein GI	220931248
COG category	[L] Replication, recombination and repair
COG ID	[COG0420] DNA repair exonuclease
TIGRFAM ID	[TIGR00619] exonuclease SbcD

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.0356343
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACTGTA TACAAAATCA ATATAAGTTT ATTGTACATG AACTTATAAC TGTTGTTATA 
AAAAGGGGGA GAGGTCCTTT GAGAATTTTA CATACTGCTG ACTGGCATCT GGGGAAACAC 
CTGGAGGGAT GGAGTAGATA TGAAGAACAA AAAGAATTTG TTGAAGAAAT AATTGAAATA 
GCTGATGATA ATAAGGTAGA CATGGTTTTA ATATGTGGGG ATATATTTGA CACTACTAAC 
CCTCCAGCGG AGGCGGAACA GCTTTTTTTT CAGGCGATGG ATTACCTGTC AAAAGGTGGG 
GAGAGGGTAA TCTGTTTGAT CTCTGGTAAC CATGATAGTC CCAACCGTCT TATGGCCCCG 
GGGCCTCTGG CTTCCAGACA GGGAATTTTT ATTATGGATG AGCCCCGGGG AGACAGGTAT 
AAGCTGGATG ATGACCGGGT GTTAAACCGT GGTCAGGGGT ACATAGAACT TGAAATTAAC 
GGAGAAGGTG TTGTCCTTAC GGCTCTGCCC TATCCTTCTG AGAGCCGGTT AAACCAGGTC 
TTTTCATGGA CCGGTGATGA CCGGGCAGTG CAGGAAAGTT ATTCCCGTCG AGTGGGTCAG 
ATTTTTTCCC ATTTAGAGCA ATATTATCGT GAAAATACAA TCAACATTGC CATGAGTCAC 
CTTTTCGTTG CCGGGGGTCA GACTACCCGG TCTGAAAGAC CCATCCAGGT TGGTGGCAGC 
CTGACAGTAT TACCGGAACA CCTTCCAGAA AAATCCCAGT ACACAGCCCT GGGCCACCTC 
CATCGTTATC AAATTGCTTC TTCAGCCCGG AGGGCTTACT ATTCAGGTTC TCCGTTGCAG 
TATAGCCTCA GTGAAAAAGA TCATAAAAAG TGTGTTAACC TTGTAGAGCT TCATCCGGGA 
GAGGAGGCCC GGATTGAACA GGTTGAATTG ACAACAAAAA AACCAATCGA GGTCTGGGAA 
GCAGAAGGGG TTGAAGAGGC TATAAAAATG GTTGAGGCCA ATAAGGACCG TTCTGTCTGG 
GCATACCTTT ATATAAATGT GGATAAAACT CTACTTCAGT CTGAAATTAA AAAAATAAAG 
GAAATTAAAA AGGATATTCT ATGTATTAAC CCCATAACCC CTGAAGAGAA ATATGAATGG 
GAAACTATAA AGATGCCTGA TGAGGACCTG GATATAATGG AATTGTTTAA AGAATATTAT 
CGTAAGACAA AAAAAGTTGA GCCTGATGAC GATATTATCA GGATGTTTAG CAGTATTGTT 
AATGATACCA GGGAAAAGGG GGAGCATGAT GAGACCGCTG CTTCTTAA

Protein sequence

MDCIQNQYKF IVHELITVVI KRGRGPLRIL HTADWHLGKH LEGWSRYEEQ KEFVEEIIEI 
ADDNKVDMVL ICGDIFDTTN PPAEAEQLFF QAMDYLSKGG ERVICLISGN HDSPNRLMAP 
GPLASRQGIF IMDEPRGDRY KLDDDRVLNR GQGYIELEIN GEGVVLTALP YPSESRLNQV 
FSWTGDDRAV QESYSRRVGQ IFSHLEQYYR ENTINIAMSH LFVAGGQTTR SERPIQVGGS 
LTVLPEHLPE KSQYTALGHL HRYQIASSAR RAYYSGSPLQ YSLSEKDHKK CVNLVELHPG 
EEARIEQVEL TTKKPIEVWE AEGVEEAIKM VEANKDRSVW AYLYINVDKT LLQSEIKKIK 
EIKKDILCIN PITPEEKYEW ETIKMPDEDL DIMELFKEYY RKTKKVEPDD DIIRMFSSIV 
NDTREKGEHD ETAAS