Gene Haur_3551 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_3551
Symbol
ID	5735410
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	4468259
End bp	4469548
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	54%
IMG OID	641280698
Product	glutamate-1-semialdehyde aminotransferase
Protein accession	YP_001546315
Protein GI	159900068
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0001] Glutamate-1-semialdehyde aminotransferase
TIGRFAM ID	[TIGR00713] glutamate-1-semialdehyde-2,1-aminomutase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATCAACG ATGCTTCTAG CGCGGCGTTT GAACGCGCCC AAGCACTTTT ACCAGGCGGA 
GTGAATAGCC CAGTGCGGGC TTTTCGGGGC GTTGGCGGCG TGCCACGCTT TATCGATCAT 
GGCGCAGGAG CCTATCTCTA CGACATCGAT GGCAATCAAT ATATCGATTA TGTTTTGTCG 
TGGGGGCCGT TAATTCTGGG CCACGCCTAT CCAGCAGTAG TCGAGGCAAT TTGTGCCCAA 
GCTCAACGTG GCACAAGCTT TGGTGCACCA ACCGAGCTTG AAAGCGAATT GGCCGAGTTG 
GTGATCGCCG CAGTACCAAG TGTCGAGATG GTGCGCTTTG TTTCGTCGGG CACTGAAGCC 
GCGATGAGCG CAATTCGTTT GGCGCGGGCT TACACCCAAC GCGAGAAAAT TATCAAATTT 
GAGGGTTGCT ACCACGGCCA TGCTGATCCA TTTTTGGTGC AAGCTGGCTC AGGTGTGGCA 
ACCTTAGGCT TGCCCGATAG CCCAGGCGTT TTGAAAAGCG CTACCAGCAA CACCCTGACC 
GCACCATTTA ACGATCTTGA AGCAGTCGAA GCGCTATTTA AAGCCAATGC TGGGCAAGTT 
GCCGCCTTGG TAATCGAGCC TGTGGCAGGC AATATGGGCT TTGTACTGCC ACGCGAAGGC 
TATCTTGCAG GCCTGCGCCA ACTTTGCGAT CAATACGGGG CATTATTGAT TTTCGACGAA 
GTAATGACGG GCTTTCGCGT GGCCTACGGT GGAGCACAAG CCTACTTCAA CGTGATGCCC 
GATTTGACCT GCTTGGGCAA AGTAGTAGGC GGCGGTTTGC CAGCGGCGGC CTATGGCGGA 
CGACGCGAGA TTATGCAGAT GGTCGCTCCA GCTGGCACAA TGTATCAAGC TGGCACGCTT 
TCGGGCAACC CACTGGCGAT GGTCGCTGGC ATTGTAACTT TACGCGAAAT TGCCAAGCCC 
GAAGTTTTCG AGCGCTTAAC TGGTGTAACT TCGACGCTGT GTCAAGGCTT TTGGAAGGCC 
GCCTTCAAAA ATGGCATTCC CTTCCAAGCG CATAAAGCTG GCAGTATGTG GGGCTTCTTC 
TTTGCTGGCG ATGAGGTTTA TGATTTCACA TCGGCCAAGC GGGCTGATAC CGCCATGTTT 
GGCAAATTCT TCCATGCCAT GCTGGAGCAA GGCGTGTATC TTGCGCCGTC GCAATTTGAG 
GCCGCCTTTG TCTCAACGGC CCATACCGAC GAACTCGTCG CTCAAACGAT AAATGCAGCC 
CAAGCGGCTT TTGCCAGCAT TCGCAGCTAA

Protein sequence

MINDASSAAF ERAQALLPGG VNSPVRAFRG VGGVPRFIDH GAGAYLYDID GNQYIDYVLS 
WGPLILGHAY PAVVEAICAQ AQRGTSFGAP TELESELAEL VIAAVPSVEM VRFVSSGTEA 
AMSAIRLARA YTQREKIIKF EGCYHGHADP FLVQAGSGVA TLGLPDSPGV LKSATSNTLT 
APFNDLEAVE ALFKANAGQV AALVIEPVAG NMGFVLPREG YLAGLRQLCD QYGALLIFDE 
VMTGFRVAYG GAQAYFNVMP DLTCLGKVVG GGLPAAAYGG RREIMQMVAP AGTMYQAGTL 
SGNPLAMVAG IVTLREIAKP EVFERLTGVT STLCQGFWKA AFKNGIPFQA HKAGSMWGFF 
FAGDEVYDFT SAKRADTAMF GKFFHAMLEQ GVYLAPSQFE AAFVSTAHTD ELVAQTINAA 
QAAFASIRS