Gene Hore_18210 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_18210
Symbol
ID	7313819
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	-
Start bp	1943539
End bp	1945029
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	45%
IMG OID	643612268
Product	Sucrose-phosphate synthase
Protein accession	YP_002509565
Protein GI	220932657
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID	[TIGR02472] sucrose-phosphate synthase, putative, glycosyltransferase domain

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.338675
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCGTA TTAAACATGT AGCTTTTTTA AATCCCCAGG GTAATTTTGA CCCCGCTGAC 
AGTTACTGGA CAGAACACCC TGATTTCGGT GGGCAGCTGG TTTATGTCAA GGAAGTATCG 
TTAGCCCTGG CCGAGATGGG AGTCCAGGTT GATATAATAA CCCGGCGTAT TAAGGATGAA 
AACTGGCCTG AATTTTCCGG AGAAATCGAT TATTATCAGG AAACTAATAA AGTAAGGATT 
GTCAGAATAC CCTTTGGTGG GGATAAATTC CTGCCCAAGG AGGAGCTCTG GCCCTATTTA 
CATGAGTATG TGAATAAGAT AATTAATTTT TACCGGGAAG AAGGAAAGTT TCCCCAGGTG 
GTAACAACCC ATTACGGTGA TGGGGGACTG GCCGGTGTTT TATTAAAGAA TATTAAAGGA 
CTTCCCTTTA CCTTTACCGG CCACTCACTG GGGGCCCAGA AGATGGAGAA ACTCAATGTT 
AATACTTCCA ACTTTAAGGA AATGGATGAA CGCTTTAAAT TTCACCGGAG GATTATAGCC 
GAGCGGCTGA CCATGTCCTA TGCGGACAAA ATTATTGTTA GCACCTCCCA GGAACGATTC 
GGTCAATACA GTCATGACCT TTATCGGGGG GCAGTTAATG TAGAGGATGA TGATAAATTC 
TCAGTCATTC CCCCCGGTGT AAATACCAGG GTCTTCGATG GAGAATATGG AGATAAGATT 
AAAGCAAAGA TCACCAAGTA CTTAGAGCGA GATCTCGGTT CAGAACGGAT GGAATTACCG 
GCCATAATAG CTTCAAGTCG CCTTGATCAA AAGAAAAACC ATTACGGTCT GGTCGAGGCC 
TATGTCCAAA ATAAAGAACT CCAGGATAAA GCCAATCTGG TTCTAACCCT GCGCGGTATT 
GAAAACCCCT TTGAAGATTA TTCCAGAGCT GGACAAGAAG AGAAGGAGAT TCTCGGTAAG 
ATAATTGAGT TGATTGATAA CAATGACTGT CGCGGTAAGG TCAGTATGTT CCCCTTAAAC 
AGTCAGCAGG AGCTGGCCGG ATGTTATGCC TACCTGGCCT CAAAGGGATC TGTATTTGCC 
CTGACTTCCT TTTATGAACC CTTTGGCCTG GCCCCGGTTG AGGCCATGGC TTCAGGCCTA 
CCGGCTGTTG TAACCAGAAA TGGTGGACCG GCTGAAATTC TGGATGGAGG AAAATATGGT 
GTTCTGGTTG ACCCTGAAGA TCCTGAAGAT ATTGCCCGGG GCCTGTTAAA AGCCTTTGAG 
AGTGAAGAGA CATGGTCCGC CTATCAGGAA AAAGGCAAGC AACGGGTTGA GGAACGTTAC 
ACGTGGCAGG AGACAGCCCG GGGTTATCTG GAGGTTATTC AGGAAATCGC TGATCGTAAG 
GATGAAGAGG ATGAAGGCGG AAGTCTGAAT ATACCGGATT ATTTTACTAA CCCCGGGGCC 
AGTAATGATG AAAAATTGCT TGACACTTTT AACAAACTCT GGAAGGAGTA A

Protein sequence

MTRIKHVAFL NPQGNFDPAD SYWTEHPDFG GQLVYVKEVS LALAEMGVQV DIITRRIKDE 
NWPEFSGEID YYQETNKVRI VRIPFGGDKF LPKEELWPYL HEYVNKIINF YREEGKFPQV 
VTTHYGDGGL AGVLLKNIKG LPFTFTGHSL GAQKMEKLNV NTSNFKEMDE RFKFHRRIIA 
ERLTMSYADK IIVSTSQERF GQYSHDLYRG AVNVEDDDKF SVIPPGVNTR VFDGEYGDKI 
KAKITKYLER DLGSERMELP AIIASSRLDQ KKNHYGLVEA YVQNKELQDK ANLVLTLRGI 
ENPFEDYSRA GQEEKEILGK IIELIDNNDC RGKVSMFPLN SQQELAGCYA YLASKGSVFA 
LTSFYEPFGL APVEAMASGL PAVVTRNGGP AEILDGGKYG VLVDPEDPED IARGLLKAFE 
SEETWSAYQE KGKQRVEERY TWQETARGYL EVIQEIADRK DEEDEGGSLN IPDYFTNPGA 
SNDEKLLDTF NKLWKE