Gene Hlac_0461 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0461
Symbol
ID	7400341
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	478779
End bp	479714
Gene Length	936 bp
Protein Length	311 aa
Translation table	11
GC content	71%
IMG OID	643707525
Product	aminotransferase class IV
Protein accession	YP_002565133
Protein GI	222478896
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0115] Branched-chain amino acid aminotransferase/4-amino-4-deoxychorismate lyase
TIGRFAM ID	[TIGR01121] D-amino acid aminotransferase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.893728
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTGAGG ACCCGGGCGG GGCGGACGAC GCGGCCGAGG AACTCCGCTA CCACGTCGAC 
GGCGAGATCG TCCCCGCCTC GCAGGCGACC GTCTCCGTCG AGGACCGCGG GTTCGCCTAC 
GGCGACGCCG CCTTCGAGAC CCTGCGCGCG TACGGCGGCG AGGTGTTCCG GTGGGACGAC 
CACGCCGCGC GACTCGCGGA CACCTGCGAG ACGCTCGGGC TCGACCACGG GCTCTCCGAG 
ATCGACCTGA AAGCCCGGAT CGACGAGACG CTCGCCGCGA ACGACCTCGC TGAGGCGTAC 
GTGAAGCTCT CTATCACGCG TGGGGTCCAG CCCGGCACGC TCGACCCGCG GCCCGAGGTC 
GACCCCACCG TCGTCGTGAT CGCGAAGCCC CTCGCCCGCG GCGGCGTCGA CTCGACACCG 
GTCCACGACG GCCCCGCCGC GCTCCAGACG ACGAAGACCC GAAAGCCCTC CTCGCGGGCG 
CTCCCGGCCG ACGCGAAGAC GCACAACTAC CTCAACGGAA TCCTCGCACG GCTGGAACTG 
CGCGTGACCG GTGCCGACGA GGCGCTGATG CTCGATCCGG ACGGCAACGT CGCCGAGGGG 
GCGACCGCGA ACCTCTTCTT CGCCGACGGC ACCGCACTCA AGACGCCCTC GCTCGACGGG 
CCGATCCTCC CGGGCGTGAC GCGTCGCACC GTGATCGAGA TCGCGGAGGC GGAGGGGATT 
CCGGTCGAGG AGGGGACGTA CGCGCCGGAC GCGGTGCGCG AGGCGGACGA GGTTTTTCTC 
ACCAACTCGA CGTGGGAGAT CCGGCCGGTC GAGACGGTGG ACGGTATCGG GGTCGACGGC 
GACGGCGAGG GCGTCGAGGG ACCGCTGACC GCGCTGCTCT CGCGGCTGTT CGATCGGCGC 
GTGGAGGAAG CGTACTACGA CGGCGAGCGG CTATAA

Protein sequence

MGEDPGGADD AAEELRYHVD GEIVPASQAT VSVEDRGFAY GDAAFETLRA YGGEVFRWDD 
HAARLADTCE TLGLDHGLSE IDLKARIDET LAANDLAEAY VKLSITRGVQ PGTLDPRPEV 
DPTVVVIAKP LARGGVDSTP VHDGPAALQT TKTRKPSSRA LPADAKTHNY LNGILARLEL 
RVTGADEALM LDPDGNVAEG ATANLFFADG TALKTPSLDG PILPGVTRRT VIEIAEAEGI 
PVEEGTYAPD AVREADEVFL TNSTWEIRPV ETVDGIGVDG DGEGVEGPLT ALLSRLFDRR 
VEEAYYDGER L