Gene Haur_1883 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_1883
Symbol
ID	5733772
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	2270240
End bp	2271898
Gene Length	1659 bp
Protein Length	552 aa
Translation table	11
GC content	49%
IMG OID	641279027
Product	histidine ammonia-lyase
Protein accession	YP_001544654
Protein GI	159898407
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2986] Histidine ammonia-lyase
TIGRFAM ID	[TIGR01225] histidine ammonia-lyase [TIGR01226] phenylalanine ammonia-lyase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCACCA CCCTTATTTT AACTGGCGAA GGCTTGGGCA TTGATGACGT TGTACGGGTT 
GCGCGGCATC AAGATCGGGT TGAACTAACC ACCGATCCAG CGATTTTAGC CCAGATCGAA 
GCGTCGTGTG CTTATATCAA TCAGGCAGTG AAGGAGCATC AGCCGGTTTA TGGGGTAACA 
ACTGGCTTTG GGGGCATGGC CAACGTAATT ATCTCGCCTG AAGAAGCTGC CGAGTTGCAA 
AATAATGCCA TTTGGTATCA TAAAACGGGG GCCGGCAAGC TCTTGCCATT TACCGATGTT 
CGCGCTGCGA TGCTGTTGCG AGCTAATTCG CATATGCGAG GTGCATCGGG TATTCGACTG 
GAAATCATTC AACGCATGGT GACGTTTCTG AATGCCAATG TTACACCACA TGTGCGTGAG 
TTTGGCTCAA TTGGGGCAAG CGGTGATCTT GTGCCATTAA TTAGCATCAC TGGAGCTTTG 
TTGGGCACAG ATCAAGCTTT TATGGTTGAT TTTAACGGCG AGACCCTTGA TTGTATCAGT 
GCACTTGAAC GTTTAGGGCT GCCACGCCTC CGTTTGCAAC CCAAAGAAGG CTTGGCGATG 
ATGAATGGTA CTTCGGTGAT GACCGGAATC GCCGCCAATT GCGTTCACGA TGCGCGAATT 
CTCTTGGCCT TAGCCTTGGA AGCCCACGCC TTAATGATTC AAGGCTTACA AGGCACGAAT 
CAATCGTTTC ACCCGTTTAT TCATCGCCAC AAACCGCATA CTGGCCAAGT TTGGGCCGCT 
GACCATATGC TCGAATTGCT ACAAGGCTCG CAGCTTTCGC GCAATGAACT TGATGGTAGC 
CACGATTATC GCGATGGTGA TTTGATTCAA GATCGCTATT CGTTACGCTG TTTACCGCAA 
TTTTTGGGGC CAATCATCGA TGGAATGGCC TTTATTTCGC ATCATCTGCG GGTCGAAATT 
AACTCAGCCA ACGATAATCC TTTGATCGAC ACTGCTAGCG CCGCGAGTTA TCATGGTGGC 
AATTTCTTGG GTCAGTATAT TGGCGTGGGG ATGGATCAGC TGCGCTATTA TATGGGGCTG 
ATGGCCAAAC ATCTGGATGT GCAGATTGCG CTGTTAGTTT CACCGCAGTT CAATAATGGT 
TTGCCAGCTT CGTTGGTTGG CAATATCCAG CGTAAGGTTA ATATGGGGTT GAAAGGGCTA 
CAGCTCACCG CCAACTCGAT CATGCCAATC TTGACCTTTT TGGGCAATTC GTTGGCCGAT 
CGTTTTCCAA CTCATGCTGA GCAATTTAAC CAGAATATCA ATAGCCAAGG CTTTGGTTCG 
GCCAACTTAG CCCGCCAAAC AATCCAAACG CTTCAGCAAT ATATTGCGAT TACGCTGATG 
TTTGGGGTGC AAGCGGTGGA TTTGCGTACC CACAAATTAG CAGGCCATTA CAACGCTGCT 
GAATTGCTCT CGCCGCTTAC CGCAAAGATC TATCACGCCG TTCGTTCAAT CGTCAAGCAT 
CCGCCCTCGC CTGAACGCCC TTATATCTGG AATGATGATG AACAAGTGCT CGAAGCGCAT 
ATTAGTGCCT TAGCTCATGA TATTGCCAAC GATGGCTCAT TGGTGAGTGC CGTTGAACAA 
ACGCTGAGCG GCTTGCGCTC AATTATTTTG TTCCGTTAA

Protein sequence

MSTTLILTGE GLGIDDVVRV ARHQDRVELT TDPAILAQIE ASCAYINQAV KEHQPVYGVT 
TGFGGMANVI ISPEEAAELQ NNAIWYHKTG AGKLLPFTDV RAAMLLRANS HMRGASGIRL 
EIIQRMVTFL NANVTPHVRE FGSIGASGDL VPLISITGAL LGTDQAFMVD FNGETLDCIS 
ALERLGLPRL RLQPKEGLAM MNGTSVMTGI AANCVHDARI LLALALEAHA LMIQGLQGTN 
QSFHPFIHRH KPHTGQVWAA DHMLELLQGS QLSRNELDGS HDYRDGDLIQ DRYSLRCLPQ 
FLGPIIDGMA FISHHLRVEI NSANDNPLID TASAASYHGG NFLGQYIGVG MDQLRYYMGL 
MAKHLDVQIA LLVSPQFNNG LPASLVGNIQ RKVNMGLKGL QLTANSIMPI LTFLGNSLAD 
RFPTHAEQFN QNINSQGFGS ANLARQTIQT LQQYIAITLM FGVQAVDLRT HKLAGHYNAA 
ELLSPLTAKI YHAVRSIVKH PPSPERPYIW NDDEQVLEAH ISALAHDIAN DGSLVSAVEQ 
TLSGLRSIIL FR