Gene Hhal_1820 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1820
Symbol
ID	4711043
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	1993704
End bp	1995296
Gene Length	1593 bp
Protein Length	530 aa
Translation table	11
GC content	71%
IMG OID	639856290
Product	histidine ammonia-lyase
Protein accession	YP_001003386
Protein GI	121998599
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2986] Histidine ammonia-lyase
TIGRFAM ID	[TIGR01225] histidine ammonia-lyase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.175616
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCGAAG TGGACCTGGC CGGCAGCCTG AGCGCCGCAG ACATCGAGGC CATCGGTTAC 
GGCCACAGGA CCGCAACGGT CTCGCCGACC GGCTGGAAGC GGCTGCGCTC GGCCGAGGCA 
TACCTCCAGC GCCTGGTGGA TGAGCGCCGC CAGGTTTACG GCGTCACCAC CGGCTACGGC 
CCCCTGGCCA CCAGCCGGAT CGACCCCTCG GCCTCACGCA CCCTGCAGCG CAACCTGGTC 
TACCACCTGT GCAGCGGCGT CGGCGAGCCG CTCTCCCGCT GTCACACCCG GGCGACGCTT 
GGCGCGCGGA TCGCCAGCGT CACCCGGGGC CACTCCGGGG TGACGCCAGC GGTGGTGGAG 
CGGCTGCTGG CGTGGCTGGA ACACGACGTG GTGCCAGAGG TGCCGGCCAT CGGCACCGTC 
GGCGCCAGCG GCGACCTGAC CCCGCTGGCC CATGTGGCCC GGGCCCTCAT GGGCGAAGGC 
CGGGTGTGCA TCAACGGCGG GGAATGGGAG CCCGCCGACG CCGCCCAACG CCGCCTCGGC 
TGGGAACCGT GGACCCTGGA CGGAAAGGAC GCCATCGCCC TGGTCAATGG CACCTCCACC 
ACCGCGGGCA TATGCGCCGT GAACGGTGCA GGTGCTGAAC GTGCCGCCGG GGTCTGTGCG 
GTGCTGGGGA TGGTTTACGC TGAGCTTCTC GGTGGCCATG CCGAGGCCTT CCAGCCGGCC 
ATCGGAGCCG TCCGGCCCCA CCCCGGGCAG ATGCGCGCCC ACGCCTGGCT CACCGCTCTT 
GCCGAGGACA GCCAGCGCCT CCAACCGTGG ACCGGCACAC CGCCCCGGCT GACCGAGGGC 
CAGGAGGCCG TGCTTCCTGA TCAGCCCCTC CCCCAAGACC CCTACTCGAT TCGCTGTCTG 
CCCCAGGCGC TGGGCGCGGT GCTGGACAGC ATCACCTTCC ACAACCAGAC CGTAGCCAGC 
GAGCTAGACG CCGCCAGCGA CAACCCCCTG CTCTTCCCGG ACGAGGGGCG CGTGCTGCAC 
GGCGGCAACT TCTTTGGCCA GCACCTTGCC TTCGCCGCCG ACGCCCTGAA CAATGCCGTG 
GTGCAGCTGG CGTTACACAG CGAACGGCGC ATCAGCCGCA TCACCGACTC AACCCGCAGC 
GGCTTTCCGG CCTTCATGCA GCCGCGCCAG ACCGGTTTGC ACAGCGGCTT CATGGGGGCC 
CAGGTCACGG CCTCGGCCCT GGTGGCCGAG ATGCGGACCG GGGCCCACCC AGCCTCCATC 
CAATCGATAC CGACCAACGC CGACAACCAG GACATCGTCC CCATGAGCAC CCGCGCAGCG 
CGGCAGGCAG CCACCAACCT GGACCATCTG CAGCGGATCT TGGCCATCGA GGCGCTGGTG 
CTGGCGCAAG GCCTCGAGCT GGCCGATGGT GTCGGGTTTA GCAGCAGCGC GCGGCGTACC 
CTGGGATGGG TACGCGAACT GGCCCCACCG CTGGAGGACG ATCGCCCGCT GGCCGAGGAG 
ATCGCCCGCG TTGCTGCTGC GCTGGCCACG CCGTACCAAG CCCACCGACT GGTTGCCGGG 
CTTCCGGGCG CGCCCCCGGG GCCAGCCTCC TGA

Protein sequence

MAEVDLAGSL SAADIEAIGY GHRTATVSPT GWKRLRSAEA YLQRLVDERR QVYGVTTGYG 
PLATSRIDPS ASRTLQRNLV YHLCSGVGEP LSRCHTRATL GARIASVTRG HSGVTPAVVE 
RLLAWLEHDV VPEVPAIGTV GASGDLTPLA HVARALMGEG RVCINGGEWE PADAAQRRLG 
WEPWTLDGKD AIALVNGTST TAGICAVNGA GAERAAGVCA VLGMVYAELL GGHAEAFQPA 
IGAVRPHPGQ MRAHAWLTAL AEDSQRLQPW TGTPPRLTEG QEAVLPDQPL PQDPYSIRCL 
PQALGAVLDS ITFHNQTVAS ELDAASDNPL LFPDEGRVLH GGNFFGQHLA FAADALNNAV 
VQLALHSERR ISRITDSTRS GFPAFMQPRQ TGLHSGFMGA QVTASALVAE MRTGAHPASI 
QSIPTNADNQ DIVPMSTRAA RQAATNLDHL QRILAIEALV LAQGLELADG VGFSSSARRT 
LGWVRELAPP LEDDRPLAEE IARVAAALAT PYQAHRLVAG LPGAPPGPAS