Gene Haur_2398 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_2398
Symbol
ID	5734279
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	3055559
End bp	3056665
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	52%
IMG OID	641279539
Product	LacI family transcription regulator
Protein accession	YP_001545166
Protein GI	159898919
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAGGC GCAACAACGC AATGAGCAAA AAACTCGAAC AACCAACCCA AACCCTAAAA 
ACGCCCCGAG GCCGCCGCCC GAATGGCAAT GGCCTTAGCA GCACCACGAT TATGGATGTG 
GCGCGTGAAG CTGGTGTCTC GTATGCAACT GTCTCGCGAG TGGTCAATAA CAAAGAATAT 
GTTAAATCGG ATACTCGTGA ACGGGTGCTG AAAGCGATTA CAAGCTTGGG CTATGTCGTC 
AACCAGCAGG CCAGAAGTTT GGCTGGTGGG CGCTCATATG CAGTTGGGTT GTTGGTGCGC 
GATCTTGGCT CAAGCTATAT GGGTGAAATT GTGCGCGGGA TTGACGAGTC GCTCAGTGCT 
GCTCAATACA ATCTGATGCT CTATACCACC CATCGCCGCA AAATCAAAGA ACGGATTTAC 
GTCAACAATT TGATCCAGGG CATGACTGAT GGGCTGCTCT TGGTTTTGCC AGAAAACCTT 
GAAGCCTATT TGGAAACTCT TGATCAGACC AACTTCCCCT ATGTCCTGAT CGATCATCAA 
GGGCTTGACG AGCGCACTCC AGTGGTGATT ACCACTAATT GGCAGGGTGG CTACGATGCC 
ACGCGCTATC TGATTGAGCT TGGTCATCGA CGGATTGGGT TTCTGACGGG CATGATGGAT 
ATGCGCAGCT CGCAAGATCG CCTGAGTGGT TATCAAGCAG CGCTGCGTGA CCATGGTTTG 
CCAGCCGATC CACAACTCGT GTATGAAGGA ACCTATTATC AACCTGAAGG CTACGCTGGG 
GCACAAAGCC TGTTGCGGCT GCCAGAGCCA CCAACAGCAA TTTTTGCCTC GAACGATGTA 
ATGGCCTTTG GGGTGATGGA AGCGGTTCGC GATGCCGGAT TGCGGATTCC AAGTGACATC 
TCGGTGATTG GCTTTGATGA TATTGCGCAA GCCTCGCAGG TAGCACCGCC ATTGACGACG 
GTCGCCCAGC CATTAGAACA ACTGGGACGC GAAGCTGTTC GAATGTTGCT AGCTCGGATC 
AATAATCCTG AGCAACCGAT AGCGCGTACC ATTTTGCCAA CTACCTTGAT TATTCGCCAA 
TCGTGCGACG TTCCTCGGAA CGTGTAA

Protein sequence

MQRRNNAMSK KLEQPTQTLK TPRGRRPNGN GLSSTTIMDV AREAGVSYAT VSRVVNNKEY 
VKSDTRERVL KAITSLGYVV NQQARSLAGG RSYAVGLLVR DLGSSYMGEI VRGIDESLSA 
AQYNLMLYTT HRRKIKERIY VNNLIQGMTD GLLLVLPENL EAYLETLDQT NFPYVLIDHQ 
GLDERTPVVI TTNWQGGYDA TRYLIELGHR RIGFLTGMMD MRSSQDRLSG YQAALRDHGL 
PADPQLVYEG TYYQPEGYAG AQSLLRLPEP PTAIFASNDV MAFGVMEAVR DAGLRIPSDI 
SVIGFDDIAQ ASQVAPPLTT VAQPLEQLGR EAVRMLLARI NNPEQPIART ILPTTLIIRQ 
SCDVPRNV