Gene Haur_1182 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_1182
Symbol
ID	5733075
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	1356745
End bp	1357905
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	53%
IMG OID	641278322
Product	ROK family protein
Protein accession	YP_001543958
Protein GI	159897711
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGGGAC TGCCCAAGAA AGCCAGTCGG GAGCAAAGCA AGCTTCACAA CTACCGACTT 
GTCTTCAAAG CCATCTACGA CGGTGGCGCG ATTAGTCGGG TGGATGTAGC ACGCTTAACC 
AACCTCACGC CAACCACAGT TTCGAGTAAC GTCGCGATCC TACTCGAAGA AGAATTGGTG 
CAAGAAGTCG GGTTAGCGCC CTCTGGTGGT GGAAAGCCAG CGACATTGCT GAGCGTATTG 
GATGATGGTC GCCACTTGAT AGGTTTGGAT GTTGCGGGAC ACGAACTGCG GGGCACGATC 
ATCAACTTAC GTGGGGCAAT TCGCCAACGC CAAACGCTCG CGCTGAATGG GGGCAATGTT 
CTCGAACAAT TGTATCAACT GATTGATCAA TTGCTAGCGA ACACCCACAG CCCAGTTCTC 
GGAATTGGCA TCGGCGCACC AGGGGTCATT AACACCACCG CTGGAGTTGT CCAACAAGCA 
GTCAACCTTG GTTGGCACAA TCTCGCACTC CGCGATTTGT TGGGCAAGCG TTATGGGTTA 
CCGGTCTATT TGGCCAACGA TAGTCATGTA ACGGCGATTG CTGAACACAC GTTTGGCAGC 
CAGCGCAACG CGGCAAACCT TGTGGTGATC AACGTTGGGC GTGGGATCGG CGCAGGCATT 
TTTATCAATG GTCGAATTGT TGGTGGTGAT GCTTGGGGAG CGGGTGAAAT CGGTCACGTC 
GTGGTTCAAC CTCATGGAAC TCTCTGTCGT TGTGGCCATT ATGGCTGCCT CGAAACTGTT 
GCCAGCACAA GTGCGCTGCT AACAAAACTT GATGCAACCC AACCACAATC ACAGCCATGG 
ACGATTGCCG AGGTCCAAGC GGCCTTAGCC GCGAATGATC CGACTGTCCG AGCCTTGGTT 
GACGAAGCTG CCTACTATCT TGGCATCGCC ATTGCAAATG TAGTGGGTTT GCTCAACGCT 
CAATCAATTA TCCTTGCTGG GTCGCTGGCC CAACTTGGCA ATGATTTACT CCAACCGTTA 
CGCCGTTCGC TAGCACAACA CGCTTTGCAG ACTTTGGTCG CCGCCACCGA TGTGCAAGTG 
AGCACCCTCG GCAGCGATAT CGTTACCCTA GGTGCAGCAG CTCTGTTACT AGCCAATGAG 
CTAGGCATTG TTCGGGATTA A

Protein sequence

MQGLPKKASR EQSKLHNYRL VFKAIYDGGA ISRVDVARLT NLTPTTVSSN VAILLEEELV 
QEVGLAPSGG GKPATLLSVL DDGRHLIGLD VAGHELRGTI INLRGAIRQR QTLALNGGNV 
LEQLYQLIDQ LLANTHSPVL GIGIGAPGVI NTTAGVVQQA VNLGWHNLAL RDLLGKRYGL 
PVYLANDSHV TAIAEHTFGS QRNAANLVVI NVGRGIGAGI FINGRIVGGD AWGAGEIGHV 
VVQPHGTLCR CGHYGCLETV ASTSALLTKL DATQPQSQPW TIAEVQAALA ANDPTVRALV 
DEAAYYLGIA IANVVGLLNA QSIILAGSLA QLGNDLLQPL RRSLAQHALQ TLVAATDVQV 
STLGSDIVTL GAAALLLANE LGIVRD