Gene Hhal_1108 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1108
Symbol
ID	4710054
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	1204329
End bp	1205822
Gene Length	1494 bp
Protein Length	497 aa
Translation table	11
GC content	71%
IMG OID	639855580
Product	4-alpha-glucanotransferase
Protein accession	YP_001002686
Protein GI	121997899
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1640] 4-alpha-glucanotransferase
TIGRFAM ID	[TIGR00217] 4-alpha-glucanotransferase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.204434
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCGGCG CGGGACTGTC CGAGCGGCGC CGCGCCGGCG TGCTGCTGCA CGTCAGCGCA 
CTGCCCGGGC CCGGGGGCAA CGGCGACCTG GGGCACCACG CCTACCGCTT CGTGGACTGG 
CTCGCCGAGG CCGGCTTCAC GATCTGGCAG ATGCTGCCGC TGGGCCCCAC CCACGACGAC 
CTCAGCCCCT ATCAAGGCCT GTCGGTGCAC GCCGGTGAGC CGTGCTACAT CGACCTGCAC 
ACGCTGGTCG AACTCGGCTG GTTGACCCCC GAGGAGATCC AGCCCCCGGA GACCGGCGAC 
GACCCCGTCG CGCTGCGGGC GTGGCGCCGC TCCTGCCTTG GCCGCGCCCG ACAACGCCTG 
CGCGATCGCA ACGACGCAAC GACCGAGGCT CAGATCGCCG CCTTCCGCCA GGCGCACGGC 
CACTGGCTGG AAGACTACGC CCTCTACGCG GCGCTGCGCG AGGAGCATGA CCTCCTGCCC 
TGGTGGCAGT GGCCCACCGC CGAACGCGAT CGGGAACCGG CGGCGCTGGA GGCGGCAGCC 
ACCCGCCTGG CCGACCGGAT CGACCAGCAG GTCTTCGAGC AGTACCTGTT CTTCACCCAG 
TGGCAGGCGC TGCGCCACTA CGCCGCGGAA CGCGGCGTCC GGTTCTTCGG CGACATCCCC 
ATCTTCGTCG CCCACGACAG CGCCGACACC TGGGCCCGGC GGGCCTGCTT CCGACTCGAC 
AGCGAGGGGC AGGCAGCGGT GGTGGCCGGC GTCCCACCGG ACTACTTCTC GGCCGAGGGG 
CAGCGCTGGG GCAACCCCCT CTACGACTGG CAGCAGCTGC AGGCCGATGG CTTCGGCTGG 
TGGCTCGAGC GCCTGGCCAC ACAGTTGGCA CTGTTCGACT TCGTGCGCAT CGACCACTTC 
CGTGGCCTGA GCGCCTGCTG GACCATCCCC GCCGAGGCCC CCACGGCCCG GGACGGGTAC 
TGGGAAGCGA CCCCCGGAGA CGCTCTGCTC GAGGCCGTTC AGGAACGCTT CGGGCGGGTC 
CCGCTGGTCG CCGAGGACCT AGGGGTGATC ACCGAGGACG TGGAGCGCCT GCGCGACCGC 
TTCGCCCTGC CGGGGATGAA GGTCCTCCAC TTCGCCTTCG ACAGCGACGC CGCCAACCCC 
TACCTGCCGC ACCACCACCA CCGCCACAGT GTGGTCTACA CCGGTACCCA CGATAACAAC 
ACCACCGTGG GATGGTACGC CGGTCTCGCG CCGGAGACCG TGGAGCGGGT CCACGCGTAC 
CTGGGCTACC CGACCGAGCC GATGCCCTGG CCCCTGACTC GAGCCGCCCT GGCCTCGGTG 
GCGAGCGTGG CCGTCATCCC CCTACAGGAC CTGCTCGAGC TGGACGGCGA ACACCGCATG 
AACGTCCCCG GCACCACCGA AGGCAACTGG CGCTGGCGCT TTGCTTGGGA GTGGCTGCCC 
GACTCCCTGG CCGGGCAGCT GTACGACCTC AACCGGCTCT ACGGCCGGCT CTAG

Protein sequence

MSGAGLSERR RAGVLLHVSA LPGPGGNGDL GHHAYRFVDW LAEAGFTIWQ MLPLGPTHDD 
LSPYQGLSVH AGEPCYIDLH TLVELGWLTP EEIQPPETGD DPVALRAWRR SCLGRARQRL 
RDRNDATTEA QIAAFRQAHG HWLEDYALYA ALREEHDLLP WWQWPTAERD REPAALEAAA 
TRLADRIDQQ VFEQYLFFTQ WQALRHYAAE RGVRFFGDIP IFVAHDSADT WARRACFRLD 
SEGQAAVVAG VPPDYFSAEG QRWGNPLYDW QQLQADGFGW WLERLATQLA LFDFVRIDHF 
RGLSACWTIP AEAPTARDGY WEATPGDALL EAVQERFGRV PLVAEDLGVI TEDVERLRDR 
FALPGMKVLH FAFDSDAANP YLPHHHHRHS VVYTGTHDNN TTVGWYAGLA PETVERVHAY 
LGYPTEPMPW PLTRAALASV ASVAVIPLQD LLELDGEHRM NVPGTTEGNW RWRFAWEWLP 
DSLAGQLYDL NRLYGRL