Gene Haur_4591 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_4591
Symbol
ID	5736436
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	5872986
End bp	5874146
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	50%
IMG OID	641281753
Product	aminotransferase class I and II
Protein accession	YP_001547350
Protein GI	159901103
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGCGCG AACGACTTTC TGCAAGGGTG CAGAGCGTTC CACCTTCAGG GATACGGCGG 
TTTTTCGATA TTGCTGCCAC AATGGATAAT GTGATTTCGC TCGGGATCGG CGAACCAGAT 
TTCGTCACGC CTTACACGAT TACCCAAGCT GGGATTCGTT CATTGCAACA GGGCAAAACT 
GCCTATACTT CGAATTCTGG GACAATCGAA TTACGCCAAG AATTGCAAAA ACACCTCAAT 
CATTTATATG GACTCAATTA TGATCCTGAG AATGAGTTGT TGATTACTGT TGGGGTCAGC 
GAAGCCTTGC AAAATGCGAT GCTGGCAACG ATCGATCCCG GCGATGAGGT GATTATTCCT 
GAGCCATGTT TTGTGGCGTA TGGCCCAAGT GTAGTGTTTG CTGGCGGGGT TCCAGTGTAT 
GTCAGCACCT CGGTCGAGCA AGAGTTTCAA GTAACCCGCG AGGCAATCGA GGCCGCGATC 
ACGCCGAAAA CCAAAGCAAT CTTGATTGGC TATCCCAATA ATCCAACTGG TGCGGTGATG 
AGCCGCGAAC GCTTGTTGGA TATCGCTGCC CTAGCTGAGC AATACGATCT CTTAGTATTT 
TCCGATGAGA TTTACGATCG TTTGGTGTAT GGCGTTGAAC ATACCAGCTT TGCCCAATTG 
CCTGGCATGC GCGATCGTAC AATTTTGCTT GGCGGGTTCT CCAAGGCCTA TGCCATGACT 
GGCTGGCGTT TGGGTTGGTT GGCGGCTAGT GCCGAAATTG CTAATGCTGT GCGCAAAATC 
CATCAATACG CTATTATGTC TGCGCCAACC GTAGCCCAAT ATGCTGGTTT AGCGGCGCTG 
CAAACTGGCG AAGAAGATGT GCAGCGCATG GTCAGCGAAT ATGATCGCCG TCGCCAAGTG 
ATTGTGGCTG GATTGCGCCA AATTGGCTTG CCAACTTTCG AGCCACAGGG TGCATTCTAT 
GTCTTTCCAC AAGTTAGTAG CCTTGGCCTA ACCAGCGAAG CCTTTGTCGA AGGCTTGCTC 
TATCGTGAAA AAGTGGCAGT TGTGCCAGGC GATGCCTTTG GCCCAAGCGG CGCTGGCTTC 
GTGCGCATGT GCTACGCTAC CAGCATGGAT AATATCGAAA CTGCCTTAGA ACGAATTGAG 
CGCTACGTTC GTTCATTGTA A

Protein sequence

MTRERLSARV QSVPPSGIRR FFDIAATMDN VISLGIGEPD FVTPYTITQA GIRSLQQGKT 
AYTSNSGTIE LRQELQKHLN HLYGLNYDPE NELLITVGVS EALQNAMLAT IDPGDEVIIP 
EPCFVAYGPS VVFAGGVPVY VSTSVEQEFQ VTREAIEAAI TPKTKAILIG YPNNPTGAVM 
SRERLLDIAA LAEQYDLLVF SDEIYDRLVY GVEHTSFAQL PGMRDRTILL GGFSKAYAMT 
GWRLGWLAAS AEIANAVRKI HQYAIMSAPT VAQYAGLAAL QTGEEDVQRM VSEYDRRRQV 
IVAGLRQIGL PTFEPQGAFY VFPQVSSLGL TSEAFVEGLL YREKVAVVPG DAFGPSGAGF 
VRMCYATSMD NIETALERIE RYVRSL