Gene Hore_06030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_06030
Symbol
ID	7314508
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	+
Start bp	656041
End bp	657591
Gene Length	1551 bp
Protein Length	516 aa
Translation table	11
GC content	42%
IMG OID	643611033
Product	prepilin-type N-terminal cleavage/methylation domain protein
Protein accession	YP_002508355
Protein GI	220931447
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG4967] Tfp pilus assembly protein PilV
TIGRFAM ID	[TIGR02532] prepilin-type N-terminal cleavage/methylation domain

Plasmid Coverage information

Num covering plasmid clones	46
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATTAT TAAAAAAAGA GAGAGGGTTA TCCTTAATAG AAGTGATGGT TTCCCTGGTT 
ATATTTGCGG TAATTGTTCT TGCTTTTGGT TCCTTTATTA CCTCAAATTA TAAAGGTATC 
CAGGAGGCCG GAGAAATGAC CAGGTCAGCC CATGAAAATA AAAAGACAGT AGAGAGAATG 
ATTGCTTCAG GACAGGTCTC CCGGGGACAT TCTTTAGAGC TTGACTTCGG GGAAGACAAT 
ATTGTGATAG ATGGTGGTAT AGCTGAATCG GGGAAACTAA GAACATTTAT TCCCACGGTC 
CCGGCCATTG TCAGTGTTAC TTCAGACCCT GAGTTTCATG TAATGGGTGA AGGACCGGTA 
ATTATCGAGG TTGTGGTTAC TACCAGAATG GTACCTGATG ACACCGCGGT TGAAGTTGAG 
TTGCGAACCC CTGACGATAT ACTGGTTGAT ACTGCAGTGG GGCAAATTCA GGATAACCAG 
GATACTCTTT ATCTTAATGC TGGGGAACAT CTCTCAGATG GCATTTATAA TATTGTAACC 
AGGGTAGATG GTATCTGGTC TCCTTTTGTT ATTAATTATG TCATCAGGCC CATTGTTTAT 
GTAGTGGTAG GGGAGGATAG CACCGTTCTC TGCTCAAATG ATGGGGAAAA CTGGACAGAC 
CACAGTGAAG AGTTGCCGGT AGATGGTGTT GATTTAAATG CTATTATCTG GGGTGGACGT 
CCTGATGACC GGAAATTTAT TATAGTCGGG GATGATGGTT ATATATTTAC CTCGGAGGAC 
GGGGTTAACT GGCAGGAGGA AATAACTCCT ACTGGTTCGG ACCTCTATGA TATTTGCTGG 
GCTAAAGAAA GGTATCTCGC CGTGGGTGAA GGGGGTATAA TTCTTACTTC CGACAGTGGT 
ACTGACTGGA ATAAGATATC TTTTGATGAT AATGTTAACC TCTATGGGGT TACATATGGT 
GGTACTTCAG AAGATAGCTT TTCAGTAGCA GTTCCGGAGG CAACTCCGAA TTATACTGTT 
GTTAAAATTG AAGGGGAAGA CCCTACCAAA AAAAATCTGA CACCATCAGA TAATCTTTAC 
AGTGCTACCT GGGGAAGTCT ACCCTCCAGT GGAGAAGGAG TGTTTATGGC TGCCGGTGTC 
CAGGATATTA TCAGTTTTGA TCATAATATT AAACTATTGA CCGATAATGG TTATTATAAT 
GAGGATTATA TTTTCAATGA TATTGTTCCG GCTTTAATAG CAGAGACCAG TACTTTTCTG 
GCAGCCGGTT CTGATGGGAA AGATGGTGTA ATTATGATAT TAAGGAAAGT GGATAGTGGT 
GGACTTATCT GGGATTACCT GCATAATGTT GACGAGCTTC CTGAAATCCC CTCAAATCTG 
GCAGGTTTTG ATGCAATAGT CTGGTTTAAT GATAGATTAG TAGCCACCGG TGTTAATAAA 
AGCGGGAGAG AAGTAATTAT TAATCTCCAT TATAACGGGG ATAGCTGGGA ATGGCAGGAT 
GTTTATACCG GTAGTGGGTA TGTGAGACTA AATGATGTGG TGGCCCGGTA G

Protein sequence

MKLLKKERGL SLIEVMVSLV IFAVIVLAFG SFITSNYKGI QEAGEMTRSA HENKKTVERM 
IASGQVSRGH SLELDFGEDN IVIDGGIAES GKLRTFIPTV PAIVSVTSDP EFHVMGEGPV 
IIEVVVTTRM VPDDTAVEVE LRTPDDILVD TAVGQIQDNQ DTLYLNAGEH LSDGIYNIVT 
RVDGIWSPFV INYVIRPIVY VVVGEDSTVL CSNDGENWTD HSEELPVDGV DLNAIIWGGR 
PDDRKFIIVG DDGYIFTSED GVNWQEEITP TGSDLYDICW AKERYLAVGE GGIILTSDSG 
TDWNKISFDD NVNLYGVTYG GTSEDSFSVA VPEATPNYTV VKIEGEDPTK KNLTPSDNLY 
SATWGSLPSS GEGVFMAAGV QDIISFDHNI KLLTDNGYYN EDYIFNDIVP ALIAETSTFL 
AAGSDGKDGV IMILRKVDSG GLIWDYLHNV DELPEIPSNL AGFDAIVWFN DRLVATGVNK 
SGREVIINLH YNGDSWEWQD VYTGSGYVRL NDVVAR