Gene Hlac_0235 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0235
Symbol
ID	7401161
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	253845
End bp	254906
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	74%
IMG OID	643707298
Product	aminotransferase class I and II
Protein accession	YP_002564910
Protein GI	222478673
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01140] L-threonine-O-3-phosphate decarboxylase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.490059
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCTCG ACACCGCGCT CGACCTCGAA CGCGAACCGC ACGGCAGCAG CGACGACCCC 
GACCCGCTGG ATTTCTCGGC GAACATCAAC CCCGAGGTTC CGCCGGGCGT TGAGGAGGCG 
TACCGCGAGG CGTTCGCGGC CGCGCGGTCG TACCCGGTCG AGCCGCCCGA GTCGTTCCGC 
GAGGCCGCCG CCGAGTACGT CGACTGCGAC CCGGACGCGG TCGTGCCGAC GCCGGGTGGA 
CTCGCCGCGA TCCGCGCGGC GATCGCGCTC GCGGTCGATC CGGGGGACAC CGCCCTGATT 
CCGGCACCGA GCTTCGGCGA GTACGCCCGC GAGGTGCGAC TGCAGGGCGG CGAGCCCGCC 
TTCGTCGCTG CCGACGCGGT CCTCGACGCC GACCCGGCGG ACCACGCGCT CGCGGTCGTC 
TGCGCCCCGA ACAACCCCAC GGGGACCGAC TACGAGCGCG CGGAGCTGGA GGGGTTCGCG 
GCGCGGTGCC GCGCGGCCGA CACGCTCCTG CTCGTCGACG AGGCGTTCCG CGGGTTCACC 
GATCGCCCCT CGCTCGCGGG GGAGGAGGGC GTCGTCGTCG CCCGGTCGCT GACGAAGCTG 
TTCGGGCTCC CCGGGATCCG GGCGGGGTTC GCGGTCGCGA CGGGCAAGTT CGGCGCGGCG 
CTGGAGCGCG CTCGACGGCC GTGGAACGTG AGCGTTCCGG CGCTGGCGAC CGGTGCGCAC 
TGCATGCGGC AGGGGGGATT TATAAGGAGA ACCCGCGAGC GCATTCGCTC GGAGCGGTCG 
CGGATGGCCG CGACGCTTGC GGAGCGGTAC GACGTGGCCC CCTCCGAGGC GCCGTTTCTG 
CTGCTCGACG TGGGAGAGGG GGAGAGGGGG CGGTCCGTTG AGCAGGCCGT GGCCGACGCC 
CGCGACCGCG GCGTCGCGAT TCGGGACGCA ACCACCTTCC GCGGGCTCGA CTCGCACGTC 
CGGGTCGCGG TGCGCCGGCC CGCCGAGAAC GACCGCCTGC TGGCGGCGCT GGGCGTTGGC 
GACGGGACGG CGACCGACCC CTCGGAGGCC GACGATGTTT GA

Protein sequence

MNLDTALDLE REPHGSSDDP DPLDFSANIN PEVPPGVEEA YREAFAAARS YPVEPPESFR 
EAAAEYVDCD PDAVVPTPGG LAAIRAAIAL AVDPGDTALI PAPSFGEYAR EVRLQGGEPA 
FVAADAVLDA DPADHALAVV CAPNNPTGTD YERAELEGFA ARCRAADTLL LVDEAFRGFT 
DRPSLAGEEG VVVARSLTKL FGLPGIRAGF AVATGKFGAA LERARRPWNV SVPALATGAH 
CMRQGGFIRR TRERIRSERS RMAATLAERY DVAPSEAPFL LLDVGEGERG RSVEQAVADA 
RDRGVAIRDA TTFRGLDSHV RVAVRRPAEN DRLLAALGVG DGTATDPSEA DDV