Gene Haur_3304 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_3304
Symbol
ID	5735174
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	4169928
End bp	4170923
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	56%
IMG OID	641280451
Product	3-isopropylmalate dehydrogenase
Protein accession	YP_001546068
Protein GI	159899821
COG category	[C] Energy production and conversion [E] Amino acid transport and metabolism
COG ID	[COG0473] Isocitrate/isopropylmalate dehydrogenase
TIGRFAM ID	[TIGR02088] isopropylmalate/isohomocitrate dehydrogenases

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.652858
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCAGGT TGTGTTTGAT TGCTGGCGAT GGGATTGGCC GCGAAGTGGT GCAAGCAGCC 
CGCCAAGTGC TCGAAGCCTT AGCAGTTCCT GCCGAGTTTG TTGAGGCCGA GGCTGGTTGG 
GAAACCTTTC AGCGCACTGG CAACGCCTTG CCCGAACAAA CTTTAGCGGC TGTCCAAGCG 
GCCAATTCAA CCTTGTTTGG CGCAGTTAGT TCGCCATCGC AGCGGGTCGC TGGCTATCGC 
AGTCCAATTG TTGGCATGCG CAAAGCCATT GATTTATATG CCTGTGTGCG GCCAGTCCAA 
ACGCCACCGC TGGCCAACGC CCGCGCTGGA GTCAATTTGG TGGTGGTACG CGAAAATACC 
GAGGGTTTGT ATAGCGGCCA AGAAACCCGC GAGGGCGATG AACGGGCTAC GGCGCAACGA 
ATTATCACCC GCCAAGCCAG CGAACGGATT GTGCAATGGG CAGTCCAATA TGCCCAACGC 
ACTGGCCGCC GCAAAATCAC GGTGGTACAC AAAGCCAATG TGCTACGCGA AACCTGTGGT 
TTGTTCCGCG AAACTGCACT GCGCGTGCTA AGCGATGCGC CCGATTTACA AGTTGAAGAA 
ATGTTAGTCG ATAACGCTGC TTATCAATTG GCGCGTGCTC CCGAGCGCTT TGAAGTGTTG 
GTCACCACCA ATTTGTTTGG CGATATTCTC TCAGATGTAG CTAGCGTTTG GGGTGGCGGG 
CTTGGTTTGG CAGCATCGGC CAATTATGGC ACGCGCACGG CGGTATTCGA GCCTGTGCAT 
GGTAGCGCAC CGGATATTGC CGGCCAAGGC ATCGCCAATC CCTTGGCAAC CTTGAGCGCT 
AGCGTGTTGA TGCTCGAATT TGTGGGCTTG AACAGCTACG CCGAGCGTTT GCAAACTGCG 
ATTCAAGCGG TATTAGCCAA TGGGCCATAT ACGCCCGATC TAGCTGGCGC GGCGACGACT 
GCCGAAGTAG TGCAAGCCGT GATTGACCAA TTTTGA

Protein sequence

MTRLCLIAGD GIGREVVQAA RQVLEALAVP AEFVEAEAGW ETFQRTGNAL PEQTLAAVQA 
ANSTLFGAVS SPSQRVAGYR SPIVGMRKAI DLYACVRPVQ TPPLANARAG VNLVVVRENT 
EGLYSGQETR EGDERATAQR IITRQASERI VQWAVQYAQR TGRRKITVVH KANVLRETCG 
LFRETALRVL SDAPDLQVEE MLVDNAAYQL ARAPERFEVL VTTNLFGDIL SDVASVWGGG 
LGLAASANYG TRTAVFEPVH GSAPDIAGQG IANPLATLSA SVLMLEFVGL NSYAERLQTA 
IQAVLANGPY TPDLAGAATT AEVVQAVIDQ F