Gene Hhal_1808 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1808
Symbol
ID	4710995
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	1981131
End bp	1982153
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	66%
IMG OID	639856278
Product	aspartate-semialdehyde dehydrogenase
Protein accession	YP_001003374
Protein GI	121998587
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0136] Aspartate-semialdehyde dehydrogenase
TIGRFAM ID	[TIGR01296] aspartate-semialdehyde dehydrogenase (peptidoglycan organisms)

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.996773
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAAGC AGTACGATGT CGCCGTAGTC GGGGCCACCG GCGCGGTCGG AGAGGTGATG 
CTCTCCATTC TGGCCGAGCG CGGCTTCCCC GCGCGCAAGA TCTACCCGCT GGCCAGTGCC 
CGCTCCGCCG GGCGGACGGT ATCCTTCGCC GGGCAGGAGC TGGAGATCCA GGACCTGGCC 
CAGTTCGACT TCTCCCAGGT GCAGATCGCG CTCTTCTCCG CCGGGGGGTC CATCTCCGCC 
GAGCACGCAC CGCGGGCGGC CGAGGCCGGG GCGGTGGTGA TCGACAACAC CTCCCACTTT 
CGCTACGACG ACGACATCCC GTTGATCATT CCCGAGGTCA ACCCGCACGC GGTGGCTGGC 
TACAAGAAGC GGGGGATCAT CGCCAATCCC AACTGTTCCA CCATCCAGAT GCTCGTGGCC 
CTCAAGCCGA TCCACGACGC CGTGGGCATC GAGCGGATCA ACGTGGCCAC TTACCAGGCG 
GTCTCCGGCA GTGGCAAGCC GGCCATCGAC GAGCTCAACG CCCAGAGCCG GGCGATCCTC 
GACGGCGGTG AGCCGCAGTG TGCTGAGTAC CCGAAGCCCA TCGCGTTCAA TTGCCTGCCG 
CACATCGACG ATTTCCAGGA CAACGGCTAC ACCAAGGAAG AGATGAAGAT GGTCTGGGAG 
ACCATCAAGA TCTTCGAGGA CTCCTCCGTT CGGGTGAATC CCACCACGGT GCGTGTGCCG 
GTGGTCTACG GCCACTCCGA GGCCGTGCAC ATCGAGACCC GCGAGCGCAT CACCGCCGAG 
CGTGCCCGGC AGGTGCTCTC CAGCGCCCCC GGGGTCGAGG TCCTGGACGA GCGCACAGGC 
GGCGGCTATC CGACGGCGCT GACGGAGGCC GCCGGACGCG ATCCGGTCTA CGTCGGGCGC 
ATCCGCGAGG ACATCAGCCA CGAGCGGGGT CTCGATCTCT GGGTGGTGGC CGATAACGTC 
CGCAAGGGGG CGGCGCTGAA CAGCGTGCAG ATTGCGGAGC TGCTGATTGG CGAACACATC 
TGA

Protein sequence

MSKQYDVAVV GATGAVGEVM LSILAERGFP ARKIYPLASA RSAGRTVSFA GQELEIQDLA 
QFDFSQVQIA LFSAGGSISA EHAPRAAEAG AVVIDNTSHF RYDDDIPLII PEVNPHAVAG 
YKKRGIIANP NCSTIQMLVA LKPIHDAVGI ERINVATYQA VSGSGKPAID ELNAQSRAIL 
DGGEPQCAEY PKPIAFNCLP HIDDFQDNGY TKEEMKMVWE TIKIFEDSSV RVNPTTVRVP 
VVYGHSEAVH IETRERITAE RARQVLSSAP GVEVLDERTG GGYPTALTEA AGRDPVYVGR 
IREDISHERG LDLWVVADNV RKGAALNSVQ IAELLIGEHI