Gene Haur_1101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_1101
Symbol
ID	5732992
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	1261589
End bp	1262593
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	55%
IMG OID	641278239
Product	homoserine dehydrogenase
Protein accession	YP_001543877
Protein GI	159897630
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0460] Homoserine dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000877297
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCACAATT TAGCAATTTA TGGCTTTGGT GGAGTCGGGC GGGCGGTGTT GGCCCAAGCC 
TTGCCGCACT TCAACCTTGC CTTGGTGGCT GATCGTTCTG GGTATGTGGC GGGACCATTG 
AGCAATGAAC GTTGGTTGGC GGTGGCGACG GCCAAAGCCC AAGGCGCAAC CCTAGCTAGT 
TTGCCCGAGG GAAGCAGCGG TGATTGGCGA GCCGCCTTGC CCGCTGGTTG TTTGGTGGCT 
GATACGACCG CCGAAGCCAA TGCCGCCCAG TTGGTTGAAT TGGTTGGGCG TGGAATGCGT 
TTGGCCTTGG CCAATAAAAA ACCGTTGTGC GAAGATTTAA ATTTGTTTCA AGCCTTGGTT 
GCTGAGCGCT GCACCCGCTA CGAGGCTACG GTTGGGGCTG GCTTGCCGAT TGTGGTGACC 
ACCAATTTAC TGCGCGATAC TGGCGATCAG GTTCAGCGCA TCGAAGGCGG TTTGAGTGGT 
ACACTGGGGT TTTTGCTCTC ATCAATCGAA CAAGGCCAGC CTTATTCGGC GGCTGTGCGT 
GAAGCTAAAG CCTTGGGCTG GACGGAACCC GACCCGCGTG ATGATTTGGG CGGTGTTGAC 
GTAGCGCGTA AAGCTTTGAT TTTGGCGCGT ACTTTGGGCT ATCAATGGAA CTTGAGCGAT 
ATTACGATTG AGCCATTGTA TCCGGCTGAG TTTGCTGATT TGAGCATTGC TGAATTTATG 
GCGCAACTTG AGCAACTTGA TCCTGGTTAT GCCCAACGCC AAGCCGAAGC TGTTGCCCAA 
GGCCAAACCT TGCGCTATGT GGCGGCGATC ACGTCTGAGG GTGCGCGAGT TGGCTTGCAA 
GCAGTTGCTA AAGATAGCCC GCTTGGCTCG CTCAAAGGGC CAGATAATAT GGTGGCTTGG 
ACAACCAACC GCTACCAAGA GCGCCCGTTG GTGGTACGCG GGCCTGGCGC AGGAGTCGAA 
GTGACCGCTT CGGCAGTCTT GTTTGATCTC TTGGCCTTCC GTTAA

Protein sequence

MHNLAIYGFG GVGRAVLAQA LPHFNLALVA DRSGYVAGPL SNERWLAVAT AKAQGATLAS 
LPEGSSGDWR AALPAGCLVA DTTAEANAAQ LVELVGRGMR LALANKKPLC EDLNLFQALV 
AERCTRYEAT VGAGLPIVVT TNLLRDTGDQ VQRIEGGLSG TLGFLLSSIE QGQPYSAAVR 
EAKALGWTEP DPRDDLGGVD VARKALILAR TLGYQWNLSD ITIEPLYPAE FADLSIAEFM 
AQLEQLDPGY AQRQAEAVAQ GQTLRYVAAI TSEGARVGLQ AVAKDSPLGS LKGPDNMVAW 
TTNRYQERPL VVRGPGAGVE VTASAVLFDL LAFR