Gene Hlac_0088 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0088
Symbol
ID	7401606
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	92216
End bp	93322
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	69%
IMG OID	643707149
Product	glycosyl transferase family 3
Protein accession	YP_002564764
Protein GI	222478527
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID	[TIGR01245] anthranilate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.826373
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTCAGG CGACTCAGGA GTTCGGCGAC TGGCCCCTCA AACGGCTGAT GACCGATGTC 
TGCGGCTCCG GCCACAAGTC GGCCGACGAC CTGACGCGCG CGCAGGCGAC CGAGGCGTTC 
GAGCGCATCC TCGCGGACGA GCCCGACCCG ACCACGCTCG GGGCGTTCTG GCTCGCGAAC 
CGCTGGAAGC GGAACACGGC CGAGGAACTC GGCGCGTACG TCGACGTGAT GTGCGAGCGC 
GTCGAATACG CCGAACCCGA CGCCGACCCC GTCGACTGCG GCGCCAACTA CGACGGCAAG 
GGACGCTCCG CGATCCTCGG CGTCGCGGCC GGCGTCGTCG CGGCCGCCGC GGGCACCCCT 
GTCGTCGTCC ATTCGGGCGA CCGGGTCCCC ACCCAGAAGC AGGACGCGTA CAAGCACGTC 
CTCGACGAGC TGGGCGTCCA CACCGAGCTG ACGCCTTCGG ACTCCGCCGA CATGGTCGAC 
GAGACCGGCT TCGGCTTCTA CTACCAGCCC GCGTTCAACC CCGCCATCGA CGACCTGTTC 
GACCGCCGCG ACCAGATGGG GGTCCGGACG TTCGTCAACA CGATCGAGAC GCTGGCGAAC 
CCCGCCGGGG CGTCGGTCCA CCTCGGCTCC TTCTACCACC TCGCGTTCGC GAAGAAGGTG 
GTCGACACGT TCGTAGAAAG CGAGTTCCAC GACCTCGACC GCGTCCTGAT GTTCCAGGGG 
ATGGAGGGGT ACGACGACGT GCGCCCCGGC TACACCAAGG TCGCCGAGTG GGACGCGGCG 
GGCGGCGACG GGGACGAAGC GGGAGACGCC GGCAGCGAGG GCGCGTCCTT CGACGACTTC 
GAGATCGAGA CCGCCAAGTA CGGGATGGAC CTCGAAGAGG AGGACCTCGC GGTCGACGAC 
GTCGCGGTCG AGTCGGCAGA AATCACCGAG GCGGTGCTGA CCGGCGAGCG CGACGGGCCC 
TTCGCCGACG CGGTCGCGGT CAACGCTGCG CTCCGTATCT ACGCCCGCGA AGACGCCGAC 
TCGATCGAGG ACGGCCTCGA CGCGGCCCGA GCAGTTATCG ACGACGGCTC CGCACACGAC 
GTTCTCGAAG CGCTTCGCGA CTTCTGA

Protein sequence

MAQATQEFGD WPLKRLMTDV CGSGHKSADD LTRAQATEAF ERILADEPDP TTLGAFWLAN 
RWKRNTAEEL GAYVDVMCER VEYAEPDADP VDCGANYDGK GRSAILGVAA GVVAAAAGTP 
VVVHSGDRVP TQKQDAYKHV LDELGVHTEL TPSDSADMVD ETGFGFYYQP AFNPAIDDLF 
DRRDQMGVRT FVNTIETLAN PAGASVHLGS FYHLAFAKKV VDTFVESEFH DLDRVLMFQG 
MEGYDDVRPG YTKVAEWDAA GGDGDEAGDA GSEGASFDDF EIETAKYGMD LEEEDLAVDD 
VAVESAEITE AVLTGERDGP FADAVAVNAA LRIYAREDAD SIEDGLDAAR AVIDDGSAHD 
VLEALRDF