Gene Haur_1181 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_1181
Symbol
ID	5733074
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	1355675
End bp	1356685
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	53%
IMG OID	641278321
Product	ROK family protein
Protein accession	YP_001543957
Protein GI	159897710
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGATCAAC GACAGCGCCG GAACGCCAAT GGCTGGCGGC TGGGAGTCGA TGTAGGGGGG 
ACGAAAATTG CCACCCTACT TGTCGATGGC GATAATCGAG TTTGGGCCAG CGTTCAACGC 
CCAACCGATA CCGCAACTCC AGACCATGCC CTCAAGTCTC TTGCTGATGC GATTTGGGAA 
ACCTTGAAAC AAGCCGACCT ACCCATTCGG CTCCTTGCGG GCATTGGGAT TGGCATTCCA 
GGCCAAGTCG ATACGCAGAG CGGGATTGTT CGGCACGCCG TCAATCTTGG CTGGCAAGCA 
GTTGATCTAC GTGGATTCAT CAACGCAACC TTTGGCACGG CCTGTGTGAT TGAAAACGAT 
GTTCGAGCAG CAGCATTAGG CATTCAACGC TATTGGTTGG CTGGTTCGAT CGATTCGATG 
TTATATGTTA GTATAGGCAC TGGCATAGCC GCTGGCATGA TTCTTGATGG TACTGTCTAC 
CGTGGTAGTC ACGGAATGGC GGGCGAAATC GGCCATGCAC GCTTCGGATC ATCAACAATT 
CGCTGTCGCT GTGGCAATTA TGGCTGTCTT GAAGCCATCG TTGCTGGGCC AGCAATTGCC 
AACTATGCAC ACTCTCTGCT CTCAACATTC CCGCATAGCC AACTGCATCA ACTCGATTCG 
ATAACCACTC CAGCAGTTTA CGCCGCTGCT GAAGCTGGCG ATGATTTAGC GTTGGCAGTT 
GCCCACATGG TTGGCGAACA ACTTGCTCAA GCCCTCTATA CCATGGTGCT TGCCTACGAT 
TGCGATCATA TTGTGCTTGG AGGCGGTGTT AGCCGCGCAG GCTCAGCCTT CTTCGCACCA 
ATCGAACAAG CACTTGATGT CTTACGTCAG CAAAGTTCTC TAGCAACATC ATTACTTCCG 
ACGGGGCGGG TTAAGCTCTT AGATCGTGAT TTTGCTGCTG GTGCATGGGG CGGAATCGCC 
TTGCTCGATA GCCAAGCGTT GGCGCGGGTT GCGCAAACGC AACTGGCATA A

Protein sequence

MDQRQRRNAN GWRLGVDVGG TKIATLLVDG DNRVWASVQR PTDTATPDHA LKSLADAIWE 
TLKQADLPIR LLAGIGIGIP GQVDTQSGIV RHAVNLGWQA VDLRGFINAT FGTACVIEND 
VRAAALGIQR YWLAGSIDSM LYVSIGTGIA AGMILDGTVY RGSHGMAGEI GHARFGSSTI 
RCRCGNYGCL EAIVAGPAIA NYAHSLLSTF PHSQLHQLDS ITTPAVYAAA EAGDDLALAV 
AHMVGEQLAQ ALYTMVLAYD CDHIVLGGGV SRAGSAFFAP IEQALDVLRQ QSSLATSLLP 
TGRVKLLDRD FAAGAWGGIA LLDSQALARV AQTQLA