Gene Hore_22040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_22040
Symbol
ID	7313752
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	+
Start bp	2399595
End bp	2401148
Gene Length	1554 bp
Protein Length	517 aa
Translation table	11
GC content	40%
IMG OID	643612656
Product	polysaccharide biosynthesis protein
Protein accession	YP_002509944
Protein GI	220933036
COG category	[R] General function prediction only
COG ID	[COG2244] Membrane protein involved in the export of O-antigen and teichoic acid
TIGRFAM ID	[TIGR02900] stage V sporulation protein B

Plasmid Coverage information

Num covering plasmid clones	44
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAAAC AATCACTGTT AAAAGGGGCT TTTATCTTAA TAATTGCGGG TTTTATAAAC 
AGGGTGCTGG GTTTCATACT AAGGATAATA CTCGTCCAGA TGATCGGTGA TGAAGGACTG 
GGCCTTTTTC AGATGGTTTA TCCCTTTTTT ATAACCCTCC TTCTTATCAG TACCGCCAGT 
TTTCCCACGG CAATATCAAA ACTTATACCG GAAAGGCTGG CCCGAAATGA TAAAAAAGGA 
GTCTATCAAT TACTCAAGAC TTCATTACTT TTTGTTGGAG GGATGGGGCT ACTTACCGGC 
ACTCTTTTAT ACTTTTTATC TGGTTTTGTA TCACAGAACA TATTCGGTGA TCCCAGAACC 
AGGATTATTT TAATGACGTT AACCCCGGCC CTTTTTATAA CCCCTCTGGC CTCAAGCCTC 
AGGGGGTTTT TTCAGGGACA CCATACTATG ATTCCTACTG CTGTATCACA GATTACAGAA 
CAAATTAACA GGATGGGCTC CACCCTGGTT ATGGTCAGTA TAACCGGCTA TCTCGGTCTT 
AAATATCAGG CAGCCAGTAT TGGGCTGGGA ATCAGTATCG GGGAACTATC CGGGTTAATT 
ATCCTCCTAT ACTTTTTTGT TACACATATC AAGACCGATA ATAAAAAGAT AACCCCCCTG 
AGAATCAAAA CCGGGGTCTT CCACTGCTTT AAAGAAATTA CTAAAATTGC CTTTCCAATC 
ACAGCAGGGC GTCTAATCAA CTCTCTGATG TTAAGTGTGG AAGCTATTCT AATTCCCAGA 
CAACTTCAAA ACAGTGGTCT GGGGGTCAGA GAAGCCACCT CCCTGTTCGG TCAATTGAGT 
GGTATGGTAG AACAGATTAT CTTCTTTCCC ACAGTGGTAA CCATCGGTCT TACTACCAGC 
CTTATTCCAA ATATATCAGA TGCCCATGCC CGGAATAATA TAACTAAAAT AAGGAAAAAC 
TATCAGGATG TTATCAGGGT AACAACGTAT CTTGGTTTTC CACTGACGGT AATCTTTTTT 
CTAAGGGGAC GGGAAATATG TAATCTTTTA TTCAACTTCC CTGCTGCTGG CCCTATTCTA 
TCAGCTATGG CTCTGACCGC CACCTTTATC TATTATCTTC ATGTCTCTTC AGGAATGCTC 
AATGGCCTCG GAAAACCTCA ACTGGCCTTA TTAAATCTGG GAATCGGCTC TGCCATAAAA 
CTTACTGGAA TTTACTTTTT AACCCCCAGA CCAGAGCTTA GAATAATTGG CTCTATAATA 
AGTATAACTC TGGGTTATAT TGCAGCTGCC ATCCTTAATT TCTTTACCAT AGGAAATACA 
ATTGGTTATG ACCTTGATAT TAAACAGACC CTGGTAAAAC CACTATTTTC CAGTTTTCTT 
ATCTTCATAA TAACTCCGTA CCTGTCCCGT ATTTTACATC CCCTTTATAA CCTTTATAAT 
ATCCGGTTGG TTACACTATT AGAACTTGTA ATACTCGGCT TTGTTTACCT GATAACCATG 
TTTGCCATAA AAGCTATCAC GGCAGATGAT ATCAAGAGGT TTACCGGTAA CTAG

Protein sequence

MEKQSLLKGA FILIIAGFIN RVLGFILRII LVQMIGDEGL GLFQMVYPFF ITLLLISTAS 
FPTAISKLIP ERLARNDKKG VYQLLKTSLL FVGGMGLLTG TLLYFLSGFV SQNIFGDPRT 
RIILMTLTPA LFITPLASSL RGFFQGHHTM IPTAVSQITE QINRMGSTLV MVSITGYLGL 
KYQAASIGLG ISIGELSGLI ILLYFFVTHI KTDNKKITPL RIKTGVFHCF KEITKIAFPI 
TAGRLINSLM LSVEAILIPR QLQNSGLGVR EATSLFGQLS GMVEQIIFFP TVVTIGLTTS 
LIPNISDAHA RNNITKIRKN YQDVIRVTTY LGFPLTVIFF LRGREICNLL FNFPAAGPIL 
SAMALTATFI YYLHVSSGML NGLGKPQLAL LNLGIGSAIK LTGIYFLTPR PELRIIGSII 
SITLGYIAAA ILNFFTIGNT IGYDLDIKQT LVKPLFSSFL IFIITPYLSR ILHPLYNLYN 
IRLVTLLELV ILGFVYLITM FAIKAITADD IKRFTGN