Gene Hhal_1120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1120
Symbol
ID	4710074
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	1216041
End bp	1217411
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	66%
IMG OID	639855592
Product	Alpha,alpha-trehalose-phosphate synthase (UDP-forming)
Protein accession	YP_001002698
Protein GI	121997911
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0380] Trehalose-6-phosphate synthase
TIGRFAM ID	[TIGR02400] alpha,alpha-trehalose-phosphate synthase [UDP-forming]

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.541755
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGTCGAC TGGTAACCGT TTCCAATCGT GTGGCCTTGC CCAGCCAGCT GCAGGCCGCG 
CAGGGTGGTC TGGCCGTCGG CCTGCGTTCG GCGCTGGAGG AGTCCGGTGG CATGTGGTTC 
GGTTGGGACG GCGGCGTGGA CGAACGCATC GACGGGTTGC GCCAGCCCCG GGTCCAGACC 
GCCAACGGGG TGCGCTACGC CACCCTGCGC CTGAGTCGCC TCGAGTACGA TCGCTACTAC 
CTGGGCTACG CCAACCAGGT GCTCTGGCCG CTGTTCCACT ACCGCATGTC CTTCGTCCAC 
TGCCGGCGCG AGCGCATCGA GGGCTACTGG GAGGTCAACC GGCTGTTTGC CGAGCATCTG 
CCACCGTTGC TCGAGGGCGA CGAGATCATC TGGGTCCACG ACTACCACTT CATTCCTCTC 
GGGCAACTGT TGCGCGAGCA GGGTGTCGAG GCCCCCATTG GTTTCTTCCT GCACACCCCC 
TTCCCGCCCT GGGACGTCTT CCGCGCCCTG CCCGGTCACG AGCCACTGCT CGAGGCGCTG 
TGCCGGTACG ATCTGGTCGG GTTCCAGACG CGCATCGACC GGGACAACTT CCTCGATTGC 
CTGACCCACT ACCGCCCGCA GCTGCAGCGC CCACGGGCCG AGGTGTTCCC CATCAGCATC 
GATGTCGATC AGGTGGCCCG GGAGGCGCAG CGGGGCTACA ACTCCCAGCA GGGGCGGCGG 
CTGCAGCAGA GCCTGCGCGA CCGTCGGTTG ATGATCGGCG TCGACCGGCT CGATTACAGC 
AAGGGCCTGC GCAACCGGTT CGAGGCCTAC GAGGCGCTGC TCGAGCAGCA CAGTGAGCAC 
CGCGGGGACG TGGTCTTCCT GCAGATCGCC CCGGTCTCCC GTGGCGATGT ACCCGAGTAC 
GAGGAGATCC GCCAATACCT GGAGTACCTG GCTGGCCACA TCAACGGTCG TTTCGCCGAG 
TACGACTGGG TGCCGCTGCG TTACCTCAAT CGCGGTTTCC ACCGTTCGAA TATCCTCGGC 
TTCCTGGCGC GTAGCGACGT CGGGCTGATC ACCCCCATGC GTGACGGCAT GAATCTGGTG 
GCCAAGGAGT TTGTCGCCGC CCAGGATCCC GGCGATCCGG GGGCGCTGGT GCTGTCGCGC 
TACGCTGGCG CTGCCGAAGA GCTCGATGGC GCGGTGCTGG TCAATCCCTA CGACGTGGAT 
CAGATGGTTG ATGCCATGCA CCAGGCGCTG ACCATGCCGC TGGGGGAGCG GCGCGAGCGC 
TGGCAGCAGA TGATGGACGC GCTACGCCGA CAGGACGTGC ATCGCTGGCG GAAGGATTTC 
ATCCAGGCCC TGCACGATGC CCACCGCGCA CGGGGTTCGG AGGCGCTGTG A

Protein sequence

MSRLVTVSNR VALPSQLQAA QGGLAVGLRS ALEESGGMWF GWDGGVDERI DGLRQPRVQT 
ANGVRYATLR LSRLEYDRYY LGYANQVLWP LFHYRMSFVH CRRERIEGYW EVNRLFAEHL 
PPLLEGDEII WVHDYHFIPL GQLLREQGVE APIGFFLHTP FPPWDVFRAL PGHEPLLEAL 
CRYDLVGFQT RIDRDNFLDC LTHYRPQLQR PRAEVFPISI DVDQVAREAQ RGYNSQQGRR 
LQQSLRDRRL MIGVDRLDYS KGLRNRFEAY EALLEQHSEH RGDVVFLQIA PVSRGDVPEY 
EEIRQYLEYL AGHINGRFAE YDWVPLRYLN RGFHRSNILG FLARSDVGLI TPMRDGMNLV 
AKEFVAAQDP GDPGALVLSR YAGAAEELDG AVLVNPYDVD QMVDAMHQAL TMPLGERRER 
WQQMMDALRR QDVHRWRKDF IQALHDAHRA RGSEAL