Gene Haur_0133 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_0133
Symbol
ID	5732028
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	164250
End bp	165329
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	52%
IMG OID	641277257
Product	isocitrate/isopropylmalate dehydrogenase
Protein accession	YP_001542913
Protein GI	159896666
COG category	[C] Energy production and conversion [E] Amino acid transport and metabolism
COG ID	[COG0473] Isocitrate/isopropylmalate dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAAGC CAACGATTGT TGTCCTTGAG GGCGATCAAA CGGGGCAAGA ACTGCTTGAA 
GAAAGTCTGC GCGTCCTTGA TCCTGCGGTG ACGGGCGTTG ATATAGAGCT AAAGCGCTAC 
GATTTGAGCC TCGAATCGCG CCGAGCGACC AATAATCAAA TTGTGTTGGA AGCAGCTCAA 
GCCATGAAGG AAGCTGGTTT TGGCTTGAAA GCCGCTACAA TCACTCCTGA AAAAGCTGGC 
GATGTTGGTA GCCCTAACGC TATTCTGCGC GAACAAATCA ATGGTACGGT GATTGTACGA 
ACGGGCCGCC GGATTCCAGG CGTGCGCCCA GTTGGTGGTG CGTATGCGCC AATCTCGGTC 
ATTCGCATGG CGGTTGACGA TGCCTATGGT GCCAAAGAAT GGCGCGAAGG CGAAGGCGAT 
AATGAAGTTG CTTATCGCAC CGAGAAAATC ACCCGTGGCA CGTGCCGCGC CGTTTCAGAA 
TATGCCTTTA TGCATGCTCG TCGCATGAAA GCCAAAGTTT TCGGTGGCCC CAAATATACG 
GTTAGCCCAA TTTATGAAGG CATGCTTAAG GAAGAAATGG ATGCAGCCGC CAAGCGCTAT 
GCCGATGTAC GCTACGAACC ACAGTTGATC GATGCGACCT ATGCTTTGCT CTTGACCAAC 
TCGGGCGATC CAATGGTGAT TCCTGCGCTC AACCGCGACG GCGACTGCTT GAGCGACTTG 
GTATTGCAAA TGTTCGGCAC GATTGCTGGC GCAGAATCAT TGCTCTTGGC CTTCGACAAA 
GATTTCAAAG TTAATGTTGT GATGGCTGAA GCACCCCACG GCACGGCTCC CAGCTTGGAA 
GGCAAGAATG TTGCTAATCC AATGGCGATG ATTTTGGCTT CGGCAGCCTT GCTTGATTAT 
ATTGATACAC CGCAAGCCAA CATGGCAGCC CGCGCGATCA GCGAAGCTAC CTTGGAAGCT 
GTCTACGACG GCGTGCGTAC TGCCGATTTG GGTGGCCACA CCACCACCAG CGATTTCACC 
GACGAAGTGA TTCGCCGCGT AAAAACCAAA ATGGAAGTTT GGCCATCGCT CGGTAACTAA

Protein sequence

MSKPTIVVLE GDQTGQELLE ESLRVLDPAV TGVDIELKRY DLSLESRRAT NNQIVLEAAQ 
AMKEAGFGLK AATITPEKAG DVGSPNAILR EQINGTVIVR TGRRIPGVRP VGGAYAPISV 
IRMAVDDAYG AKEWREGEGD NEVAYRTEKI TRGTCRAVSE YAFMHARRMK AKVFGGPKYT 
VSPIYEGMLK EEMDAAAKRY ADVRYEPQLI DATYALLLTN SGDPMVIPAL NRDGDCLSDL 
VLQMFGTIAG AESLLLAFDK DFKVNVVMAE APHGTAPSLE GKNVANPMAM ILASAALLDY 
IDTPQANMAA RAISEATLEA VYDGVRTADL GGHTTTSDFT DEVIRRVKTK MEVWPSLGN