Gene Hore_06040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_06040
Symbol
ID	7314509
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	+
Start bp	657612
End bp	659366
Gene Length	1755 bp
Protein Length	584 aa
Translation table	11
GC content	39%
IMG OID	643611034
Product	prepilin-type N-terminal cleavage/methylation domain protein
Protein accession	YP_002508356
Protein GI	220931448
COG category
COG ID
TIGRFAM ID	[TIGR02532] prepilin-type N-terminal cleavage/methylation domain

Plasmid Coverage information

Num covering plasmid clones	50
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTTTTCAA GGTTTTTTAC CAGCAATAAA GGATTAACCC TTATTGAGAT ATTAGTGGCC 
CTGGCTCTGG TAGGGATTGC ATCTACAGCT ATCTATGGCT TTTTAAATTT TACTGTTAAT 
AACTATCAGG ATGGAGAAGA AAAAATAAGG GTTCAGGATT ATACCAGACT GGTAGCGGAT 
GAGATTACTG AAGAACTGAG GGGAGTTACT TCAGCAAGAC TAATAGAAGA TGTAGACAGT 
AGTGAAATTG ATTCAGAGAA TTATAACTAT ATGTATGTAA AACCGGATAT TGATCTGGTG 
ATAAAGAGGG TAAAAAACGA ACTGGGTCTT ATAGTTGAAG AAAAAATCCC CGGAGTATCG 
GGGGTAAAAT ATGTGGATCA GGCTGGCAAT GTAATAAAAG ATTTTACTCC TGATTATGAA 
CTAACCTTTT TCATAGATGA TGATAACCCC GGAGTGCTTC ATTTTAATTT AGTGGAAGTT 
AATAGTGGTT TTGAAGTGGA ATCAGCTGTA TATCTGATTA ATATAGAAGG TGATATCAGT 
GGGGTCACTG AAGGAAAAAT GCTTGAATAC ACATCACTTT ATGATACGGG TGACCCCTTT 
GCCCATCTGG ATTTCAATAA ATTCTGGTAT GAATGGTTGC AGGAAAATTA TCAGGATGAG 
GGTATGATTG GTGAGGGTGA TTATGGTGTC AATTTTCCCC TGGATGGTGG GGAACTTACC 
CTGACTATTA CGGGTTCGGG TAATGCTGCA GCTGGAGGGG CTATGCTTTT AAAGGAATTA 
AATTCTGACC ATTTTCCCGA AGGGGCAGAT ATAACAAGCT TTGCGGTTGT TGTCGATGCC 
AGAAACCTTG ATGTTGGTGA AGGCGGTTAC GGGGTTCTAC TAAGGGGGGA GGTAATTCAG 
GCCAGGGATA AAGATGGAGA AATACTTGAA AATCAGTATA ATGATTATGG TTATATGTTC 
CAGTTTGACC CCGGGGCCAG GGGGTTTGTG ATCAGGAGGA TAAAAGGAGG CTTTCATGAT 
GTTGAAAATA ATATTGGGGC CTCTCTGATA ACAGGTAATG GTTATAACAC CCGTTTCGGT 
GCACCTTATG CTCCGGAACA CCTGGTTAAT GATGTCTTTC ACTGGAGTGG TTATCAGGAC 
TGGTTTAAAA GGTATAAAAC TGTAATAAAA GTTCAGACCC AGCCCGGTGG TGATTTAATA 
TTGAGGGCAC ATCTTATTGA CGAGGATGGT CACAGATCAG ATGAAATGAT CTTTGGTGAT 
TTTAATAAAC TGACGCTTAT CGGTAAATAT GGGGAAGAGA ATATATTTGA TGGCAGAAAG 
CTCGATTATG ATTACTGGAG TAATGAAGAT GTAACCCTCC CTGGTAATAT TATCGGGCTC 
AGGAGCTGGG ATATGCATAA TAATGAACAT ACAACCGAGT TTTATGAAAT TTCAATTGCC 
CCGGCTGAAC CCGGTGTGAT AGATATAGAT TATGATAATA AAGTAATTAC ATTAACTTTT 
GATGAAGAGG TAATAGCCGA TGATTTATCA TTATTAACTG GTAATTTTAT AATTACAAGG 
GTTACTAATA ATATGGAATT TACTGTTTTC AGTATTGAAC AGGGAAACAC CACCAGGTCT 
ATCGAATTAA ATCTCAGTAG TGCCCTGGGC AAGGGAACCT ATCTTATCAG TTATAGCAGA 
CCAGCTTCAG GGGGACTTGC CGATTCGGAA GGAAATTTAG TTGAAGATTT TGATAGATAT 
CTGGAAATTA ACTAA

Protein sequence

MFSRFFTSNK GLTLIEILVA LALVGIASTA IYGFLNFTVN NYQDGEEKIR VQDYTRLVAD 
EITEELRGVT SARLIEDVDS SEIDSENYNY MYVKPDIDLV IKRVKNELGL IVEEKIPGVS 
GVKYVDQAGN VIKDFTPDYE LTFFIDDDNP GVLHFNLVEV NSGFEVESAV YLINIEGDIS 
GVTEGKMLEY TSLYDTGDPF AHLDFNKFWY EWLQENYQDE GMIGEGDYGV NFPLDGGELT 
LTITGSGNAA AGGAMLLKEL NSDHFPEGAD ITSFAVVVDA RNLDVGEGGY GVLLRGEVIQ 
ARDKDGEILE NQYNDYGYMF QFDPGARGFV IRRIKGGFHD VENNIGASLI TGNGYNTRFG 
APYAPEHLVN DVFHWSGYQD WFKRYKTVIK VQTQPGGDLI LRAHLIDEDG HRSDEMIFGD 
FNKLTLIGKY GEENIFDGRK LDYDYWSNED VTLPGNIIGL RSWDMHNNEH TTEFYEISIA 
PAEPGVIDID YDNKVITLTF DEEVIADDLS LLTGNFIITR VTNNMEFTVF SIEQGNTTRS 
IELNLSSALG KGTYLISYSR PASGGLADSE GNLVEDFDRY LEIN