Gene Hmuk_1771 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_1771
Symbol	trpD
ID	8411296
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	-
Start bp	1692879
End bp	1693877
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	69%
IMG OID	645020100
Product	anthranilate phosphoribosyltransferase
Protein accession	YP_003177592
Protein GI	257387819
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID	[TIGR01245] anthranilate phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	0.983535
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.303854
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGGAAT ACATCGAACG CGTGACCGAG GGAGAGGATC TGACACAGGA CGAGGCTCGC 
GAGGCAGCGA CGGCGGTCTT CGAGGACGCC ACGGAGGCCC AGATCGGGGC ACTGCTGGCG 
GGTCTGCGAG CGAAAGGGGA GACCGAAGCG GAGATCGCCG GCTTCGCCGA GGGGATGCGC 
GACGCCGCGC GGACGATCGA CCCCGACCGG CGGCCGCTGG TCGACACCTG TGGCACCGGC 
GGCGACGACT ACGACACGAT CAACGTCTCG ACGACGAGCA CGATGGTCGC CGCGGGTGCC 
GGCGTCCCCA TCGCCAAGCA CGGTAACTAC TCAGTCTCCT CCTCGTCGGG GAGCGCGGAC 
GTGCTGGAGG TGGCCGGCGT CGACGTGGAG GCCGAACCGC CACAGGTCGA GCAGGCCATC 
GAGGACGACG GGATCGGGTT CATGCTCGCG CCCGTCTTCC ACCCGGCGAT GAAGGCCGTC 
ATCGGCCCGC GCAAGGAACT CGGCATGCGG ACCATCTTCA ACATCCTCGG ACCGCTGACC 
AACCCCGCCG GTGCGGACGC GCAGGTGCTC GGCGTCTACG ATCCGGCCCT CGTGTCGACG 
ATCGCGGAGG CACTGGCTCG GATGGACGTC GAGCGAGCGA TGGTCGTCCA CGGATCGGGC 
CTCGACGAGA TCGCGATCCA CGGAGAGACC GTCGTCGCAG AGGTCACCGG TTCCGAGATC 
GAGGAGTACA CGCTCGTCCC GGAGGACATC GGACTGACGA CGGCCGACAT CGAAGACGTG 
GCCGGCGGCA CGCCCGAAGA AAACGCCGAG GACCTGCGAG GGATCGTCGA GGGGACCGTC 
ACCGGACCGA AACAGGACAT CATCCTCGCG AACGCGGGCG CGGCGATCTA CGTCGCCGGT 
GAAGCCGACA GCCACGAGGC CGGCGTCGAG GCGGCTCGCG AGGCGATCGA GTCCGGCGAC 
GCCGCCCGGA AGTTCGACGA GCTCAGAGGC GAGGCATGA

Protein sequence

MQEYIERVTE GEDLTQDEAR EAATAVFEDA TEAQIGALLA GLRAKGETEA EIAGFAEGMR 
DAARTIDPDR RPLVDTCGTG GDDYDTINVS TTSTMVAAGA GVPIAKHGNY SVSSSSGSAD 
VLEVAGVDVE AEPPQVEQAI EDDGIGFMLA PVFHPAMKAV IGPRKELGMR TIFNILGPLT 
NPAGADAQVL GVYDPALVST IAEALARMDV ERAMVVHGSG LDEIAIHGET VVAEVTGSEI 
EEYTLVPEDI GLTTADIEDV AGGTPEENAE DLRGIVEGTV TGPKQDIILA NAGAAIYVAG 
EADSHEAGVE AAREAIESGD AARKFDELRG EA