Gene Haur_1052 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_1052
Symbol
ID	5732956
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	1201129
End bp	1202280
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	51%
IMG OID	641278187
Product	aminotransferase class I and II
Protein accession	YP_001543828
Protein GI	159897581
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGCAGC CAATTCATGG GGCAATTGAT TATGCTGAAT TGCAGCAACG TGGGCTTGTA 
GCCAGCCAAA TTGATGATTT CAGCAGCAAC GTCAATCCGC TTGGCACGCC GAGTTTTATT 
CGCGAAGCGC TGGCAACTGT TGATTTGGCG CATTACCCCG ATCGTCAATC GTTGGCCTTG 
CGGGCGGCGC TGGCCAAACG CCATTGTTGT GAACTTGAAC AGCTATTGAT TGGTAATGGT 
AGCAATGAGT TAATTCATCT GATTGCGCGG GCCTTGTTGC AACCAAACGA TCCAGTTTTG 
TTGATTGAAC CAACCTTTGG CGAATATGCC TATGCTAGCA GCTTGGCTGG CGCTCAATTG 
TTGCGCTATC AAGCAACCAG CGAAACTGGA TTTGCAATTG ATATTGTAGC TTGTTGTCAT 
TTGATCAAGC AACATCGCCC GCGCTTGGTT TGGCTGTGCA ATCCCAATAA TCCCACTGGC 
AGCTATTTGG ATGCTGAAGC GATTGCCCAA CTTCAAGCAG CGTGTACCAC AGTTCAAGCC 
TATTTGGTGC TCGATTTGGC GTATGCTGAT TTGGTTGTTG GGGATTGGGG ATTGGGGATT 
GGGGATTGGG GATTGGGTGA ATCGAATTCC TCTCGCCGAC AAGACGGGCG AGAGTCTGGG 
AACGGGGGAA GGTTAACCAG CCCCCAGCTC CCAGCCCCCG ACAACCATCA TCAGATTATT 
TATCTCTACT CGTTGACCAA AAGCTATGCC TTGGCGGGGT TGCGTTTGGG CTATGTGGTG 
GCTGAGCAAG CGGTTATCGC TCGCTTGCAG CGTTGGCAGC CGCAATGGAG CGTCAATAGT 
TTGGCTCAGG CCGCAGGTCT AGCGATTTGC CAACATCCAC ATTGGCTAGC CCAACAGCTT 
GAGCAATGGT GGATTTGGAG CGAACAATTA CGCCAGGGTT TGAGCCAACT TAGCTTGAAG 
GTCTTGCCAA GCTGCTTGCC ATTTTTCTTA GTTGAAGTGG CGAACGCCCA GCAAACCCGT 
AGTGCGCTGC TTAACCACGC TTGTTTGGTG CGCGATTGTA GCTCATTTGG TTTGCCGCAG 
TTTGTACGGA TCGCCCCGCG CCAACCAGCG GCAAATCAAC GCTTGTTGAA TGCTTGGAGA 
AGTTTATGCT AG

Protein sequence

MQQPIHGAID YAELQQRGLV ASQIDDFSSN VNPLGTPSFI REALATVDLA HYPDRQSLAL 
RAALAKRHCC ELEQLLIGNG SNELIHLIAR ALLQPNDPVL LIEPTFGEYA YASSLAGAQL 
LRYQATSETG FAIDIVACCH LIKQHRPRLV WLCNPNNPTG SYLDAEAIAQ LQAACTTVQA 
YLVLDLAYAD LVVGDWGLGI GDWGLGESNS SRRQDGRESG NGGRLTSPQL PAPDNHHQII 
YLYSLTKSYA LAGLRLGYVV AEQAVIARLQ RWQPQWSVNS LAQAAGLAIC QHPHWLAQQL 
EQWWIWSEQL RQGLSQLSLK VLPSCLPFFL VEVANAQQTR SALLNHACLV RDCSSFGLPQ 
FVRIAPRQPA ANQRLLNAWR SLC