Gene Haur_3668 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_3668
Symbol
ID	5735529
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	4612075
End bp	4613085
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	51%
IMG OID	641280817
Product	GHMP kinase
Protein accession	YP_001546432
Protein GI	159900185
COG category	[R] General function prediction only
COG ID	[COG2605] Predicted kinase related to galactokinase and mevalonate kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAATTGT TTAAAGCCAA AGCACCAATG CGGATTGGTT TTTTCGGCGG GGGCACTGAT 
GTTAGCCCAT ATGCCGAAGA ACATGGCGGC AAGGTGCTTA ATTGTACGAT TGATAAATAT 
GTGCGCTGTA TGCTCAAGCC GATCGATCAG CCTGGAATTA CGATTCGCTC ACTCGACTTG 
AGTGCCGTTA GTCGGGCGGT AACTGGGCGT GAATGGGATG GCAAACTTTC GTTGCCCCAA 
GCAGTAATCG ATGCTCATCC TGAAATCAAC GGCGTAGAAA TTACCATGTT CAGCGATGTG 
CCACCAGGTT CAGGCTTAGG TTCTTCCTCG GCTTTGGTGG TGAGCATGCT CAAATTGCTC 
GATACTGCCT ACCACCTCAA GCTCGATGCC TACGAAATGG CCGAGTTGGC CTATCGCATC 
GAACGAGTTG ATTTGGGGAT TCCAGGTGGT CGCCAAGACC AATATACAGC GGTGTTTGGT 
GGCATGGCCG TGCAGCATTT CGGCGGCCCA CAGGTGATCA TCGAACGCGT TGCGACCAGT 
GAAGATGCTC TGTTGGAACT AGAGTCGTGC CTGATTATTG GCTATGTGCG GGATCGTAAG 
CTGCTGACCC ATAATTTGGT GCAAGACCAA GTGCGGCGGG TGACCGAGGG CGAAACCTTG 
CGTCTGCACG ATGAAACCAA AGCCATGGTT GATGAGGGTG CGAAACTCTT GCGGCGTGGT 
CAGATCAAAG AATTTGGCAA ACTGCTTCAC CATGCTTGGG AAATTAAAAA AGCCTTCTCA 
CCACATATTG CGCCGCCAAT TGTCAACGAA ATTTATGATT TAGCCTTGCG CCAAGGGGCT 
TGGGGTGGCA AATTATCGGG TGCTGGTGGC GGTGGCTTTA TGTGTTTCTG TGTGCCATTT 
AGCAAGCGGC TGCAACTCGA AGCGGCCTTG ATTGAAGCAG GCGTGACCGT GCGACCCTTC 
TCGTTTACCA AGCAAGGCGT GCATGCTTGG AGTGTTGAAG AAGACGATTA A

Protein sequence

MKLFKAKAPM RIGFFGGGTD VSPYAEEHGG KVLNCTIDKY VRCMLKPIDQ PGITIRSLDL 
SAVSRAVTGR EWDGKLSLPQ AVIDAHPEIN GVEITMFSDV PPGSGLGSSS ALVVSMLKLL 
DTAYHLKLDA YEMAELAYRI ERVDLGIPGG RQDQYTAVFG GMAVQHFGGP QVIIERVATS 
EDALLELESC LIIGYVRDRK LLTHNLVQDQ VRRVTEGETL RLHDETKAMV DEGAKLLRRG 
QIKEFGKLLH HAWEIKKAFS PHIAPPIVNE IYDLALRQGA WGGKLSGAGG GGFMCFCVPF 
SKRLQLEAAL IEAGVTVRPF SFTKQGVHAW SVEEDD