Gene Hhal_2349 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_2349
Symbol
ID	4711395
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	2574808
End bp	2575728
Gene Length	921 bp
Protein Length	306 aa
Translation table	11
GC content	68%
IMG OID	639856824
Product	branched-chain amino acid aminotransferase
Protein accession	YP_001003914
Protein GI	121999127
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0115] Branched-chain amino acid aminotransferase/4-amino-4-deoxychorismate lyase
TIGRFAM ID	[TIGR01122] branched-chain amino acid aminotransferase, group I

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.888959
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCTTCG CCGATCGCGA CGGTTACATC TGGCTCGATG GTGAGATGCT GCCCTGGCGC 
GAGGCCCGGG TCCACTGCCT GACCCACACG CTCCACTACG GCATGGGCGT CTTCGAAGGC 
CTCCGCGCCT ACACCACCGA GCACGGGCCG GCGATCTTCC GGCTCGAGGA ACACACCCGG 
CGGCTGTTCA ACTCGGCCAA GATCCTCGGC ATGGAGATCG CCCACAGCCC CGAGGCGATC 
AATCAGGCCT GCATCGACGC GGTGCGCCGC AACGGGCTGT CCAGCGCCTA CATCCGGCCG 
ATGTCGTTCT ACGGCTCGGA GGGCATGGGG CTGCACGCCG ACGGCCTGCG CACCCACACC 
ATGGTGGCCG CCTGGCACTG GGGCGCCTAC CTCGGCGATG AGAGCCGCGA GCGCGGCATC 
CGCGTGCAGA CCAGCTCGTT CACCCGGCAC CACGTCAACA TCGCCATGTG CCGGGCCAAG 
GCCAACGGCA ACTACATGAA CTCCATGCTC GCCGTCCAGG AGGCCACCCG TGCCGGCTGC 
GACGAGGCGC TGCTGCTCGA CGTGGACGGT TTTGTCTGTG AGGGCTCCGG CGAGAACTTC 
TTCATGGTCC GTGACGGCGT GCTGCACACC CCGGCGCTCA CCTCCGCGCT GGAGGGCATC 
ACCCGGGACA CGGTCATGCG GCTCGCCGCC GAAGAGGGCA TCGAGGTGCG CGAGCGGCGG 
ATCACCCGGG ACGAGGTCTA CATCGCCGAC GAGGCCTTCT TCACCGGCAC CGCGGCCGAG 
GTGACCCCGA TCCGCGAACT CGACGGCCGG ACCATCGGTC CCGGCCACCG TGGCCCGATC 
ACCGAGCGAC TCCAGTCCCG CTACTTCAAT CTGGTCGAGG GGCGCGACCC GTCCCACACC 
GACTGGCTCA CCTTCGTCTG A

Protein sequence

MSFADRDGYI WLDGEMLPWR EARVHCLTHT LHYGMGVFEG LRAYTTEHGP AIFRLEEHTR 
RLFNSAKILG MEIAHSPEAI NQACIDAVRR NGLSSAYIRP MSFYGSEGMG LHADGLRTHT 
MVAAWHWGAY LGDESRERGI RVQTSSFTRH HVNIAMCRAK ANGNYMNSML AVQEATRAGC 
DEALLLDVDG FVCEGSGENF FMVRDGVLHT PALTSALEGI TRDTVMRLAA EEGIEVRERR 
ITRDEVYIAD EAFFTGTAAE VTPIRELDGR TIGPGHRGPI TERLQSRYFN LVEGRDPSHT 
DWLTFV