Gene Hhal_0137 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_0137
Symbol
ID	4710670
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	156150
End bp	157310
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	69%
IMG OID	639854595
Product	glucose sorbosone dehydrogenase
Protein accession	YP_001001733
Protein GI	121996946
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2133] Glucose/sorbosone dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCCGAG TCACGCCGCG CGTCGCTGCC CTCGCCGGTC TCCCGCTGAT CGGCGGGTCC 
GCCCTCGCCG GGGAGGTGAT CGAGGCCAAC CACGACACCG AGTACCACGG CGTGCGCATC 
GTGCAGGTGG CCACGGACCT GGAACACCCC TGGGGGCTGG CCTTCCTGCC CGACGGCGGC 
ATGCTGGTCA CCGAGCGCCC GGGCCGCATC AACCGGATCG AGGACGGCCA GGTCGAGCGC 
CTATCAGGCG GCCCCGAGAA CGTCTTCGCC CGCAACCAGG GCGGGATGCT CGATATCGCC 
CTCCATCCGG ACTTCGATGA CAACCGCCAG GTCTACTTCA CGTACGCGCA CGGTGATGCC 
GACGAGACCA CCGTAGCGCT GGCGCGGGCA CGCCTCGATG AAGACGCGCC CCGGCTGACC 
GACCTCGAGG AGCTCTTGGT GGCCGATGCC GGGGCCAGCC CCGGGCGGCA CTACGGCTCA 
CGGATCGATT TCAAACCGGA CGGGACCCTG CTCATGACCG TCGGTGACCG CGGCGATGAC 
GAACACGATC CGGACAGCCA CCGCGCCCAG GACAACAGCA ATCACGTCGG GACCACCCTG 
CGCCTGAAGG ACGACGGCTC GGTGCCCGCC GACAACCCCT TCGTTGAAGA CGACGAGGTG 
CGCGACGAGA TCTACACCTA CGGCCACCGC AACGCCCAGG GTCAGTTCAT TCACCCGGAG 
ACCGGTGAGA TCTGGCAGAG TGAGCACGGG CCGCGAGGTG GCGATGAACT CAACCGGGTC 
CAGGCCGGGC ATAACTACGG GTGGCCGATC ATCTCCCATG GCCGCGACTA CGCCACCCAG 
GAACCGATCG GGACCGGGCG CCATGCCGAG GGCATGGAAT CGCCCATCCG GGACTGGACC 
CCGGCCATCG CACCCTCGGG GCTGGATCAC TACAGCGGCG AGGCGTTCCC GCGCTGGGAG 
GGGGATTTCC TGGCCGGCGC GCTGGTGCGC CCGGCGGTGC GCCGCGTGGT CGTCGAGGAC 
GACACGGTGG TCCACGAAGA GGAGATCCTG CGCGACGCCG TGGGTCGGGT CCGCGCCGTC 
CAGGAGGGCC CCGAGGGACG GATCTATCTG CTGACCGACG AATCCGATGG CGGCATCTAC 
CGCCTGGAAC CTGCCGACTG A

Protein sequence

MIRVTPRVAA LAGLPLIGGS ALAGEVIEAN HDTEYHGVRI VQVATDLEHP WGLAFLPDGG 
MLVTERPGRI NRIEDGQVER LSGGPENVFA RNQGGMLDIA LHPDFDDNRQ VYFTYAHGDA 
DETTVALARA RLDEDAPRLT DLEELLVADA GASPGRHYGS RIDFKPDGTL LMTVGDRGDD 
EHDPDSHRAQ DNSNHVGTTL RLKDDGSVPA DNPFVEDDEV RDEIYTYGHR NAQGQFIHPE 
TGEIWQSEHG PRGGDELNRV QAGHNYGWPI ISHGRDYATQ EPIGTGRHAE GMESPIRDWT 
PAIAPSGLDH YSGEAFPRWE GDFLAGALVR PAVRRVVVED DTVVHEEEIL RDAVGRVRAV 
QEGPEGRIYL LTDESDGGIY RLEPAD