Gene Haur_3855 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_3855
Symbol
ID	5735734
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	4839330
End bp	4840334
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	51%
IMG OID	641281006
Product	aminoglycoside phosphotransferase
Protein accession	YP_001546617
Protein GI	159900370
COG category	[R] General function prediction only
COG ID	[COG2334] Putative homoserine kinase type II (protein kinase fold)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.000520845
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGCAAG CCCTTGCCCC CGACCCTGCC ACGATTCGTC AACATCTTAC CCAAACCTAT 
GCGATTCAGC CCAACCGCAT CGAGCAAATC AATCGTGGCA ATGACCCACG CGCGGCGATT 
TACCATGTGC AAACCAACGA ACAACCCTAC TTTCTCAAGC TCAAGGCTGG CTCAATCTAT 
CAGGCAGGGG TGTTATTATC GCGCTATCTC AAGGATCGGG GAGTGGCGGC GGTTGCGCCA 
GTCGATACCC GCACCCAGCA GCTTTGGAGC CATTGCCAAC AATTTCATAG CGTGCTCTAC 
CCCTATATCG AAGGCGCAAC AGGCATGGAC CAAGGCATGT CGGCGCTGCA ATGGCGGAGT 
TTTGGCCAAC AATTGCGCCG AATTCATACG ATGCAAGTGC GTGCGCCGCT ACGCCAGATG 
CTGCAATGGG AGCAATTTCG CCCGCTCTGG TTGCCAACGG TTCAAGCAAT TCACAACAGC 
ATCAATACTT GGCCAATTGG CGATAGCTAT AGCGCCGAGT TAATTGATTT TTGGCGAGTC 
AAATCGGTCG AAATCAGTTA TTTGATCAAG CGAATTAGCG CATTAGGCCA TGAGCTAAGG 
GCCAATGCTG GTGATTTTGG CCTGAGCCAT GGCGATATTC ACACCGCCAA CATTGTGCTC 
GATCAGATTC AACAGATTAA TATCGTCGAT TGGGATTACC CGATGTTTGC TCCCAAAGAG 
CGTGATTTGC GTTTTGTGGT TGGTTCTGTC ATCGGTGTGC CAGTGCAGCA GCATGAAGAA 
CAATGGTTTT TTGAGGGCTA CGGCCAACCA ACGATTGACT ACAAAGCCTT GGCCTACTAT 
CGTTATGAGC GGGTGATTCA AGACCTTGGC GATTATGCCC AGCGGGTATT GTTACGCCGT 
GATGCCCCGC CAGCATTCAA ACAAGCCGCC TTACAATCGT TGCGTTCGCG CTTTTCGACT 
GGCAATATCA TCGAATCGGC CTATCAAGCT GATCGCACAA GTTAA

Protein sequence

MQQALAPDPA TIRQHLTQTY AIQPNRIEQI NRGNDPRAAI YHVQTNEQPY FLKLKAGSIY 
QAGVLLSRYL KDRGVAAVAP VDTRTQQLWS HCQQFHSVLY PYIEGATGMD QGMSALQWRS 
FGQQLRRIHT MQVRAPLRQM LQWEQFRPLW LPTVQAIHNS INTWPIGDSY SAELIDFWRV 
KSVEISYLIK RISALGHELR ANAGDFGLSH GDIHTANIVL DQIQQINIVD WDYPMFAPKE 
RDLRFVVGSV IGVPVQQHEE QWFFEGYGQP TIDYKALAYY RYERVIQDLG DYAQRVLLRR 
DAPPAFKQAA LQSLRSRFST GNIIESAYQA DRTS