Gene Hmuk_0828 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_0828
Symbol
ID	8410342
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	+
Start bp	799406
End bp	800503
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	66%
IMG OID	645019163
Product	peptidase M29 aminopeptidase II
Protein accession	YP_003176666
Protein GI	257386893
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2309] Leucyl aminopeptidase (aminopeptidase T)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACCCAC GTGTCCGCGA ACACGCAGAG ATCGTCGCAG ACCACTCCGT CGAGCTGCAG 
GCCGGTGACG ACGTCGTCAT CGACGCCCAT CCCGACGCGG CGGACCTCGT GACGGCGCTC 
CACGAGGTGA TCGCCGACCG CGGCGCGAAC CCACTCACCG TCCAGGACCG CCTCGGTGCT 
CGCTTCCGAC GCGCGTATCT GCGCAACCAC GACGGCGACT TCGAGACGCC GGCACACGTC 
CAGGCGCTGT ACGACGAGAT GGACGTGTAC ATCGCCATCC GCGGCGGCGG CAACGCCACC 
GAGACCAGCG ACGTCGACCC CGAGACGACC GCGGCCTACC AGCAGGCCCA GCAACCGCTG 
CTCGACGAAC GCCTCTCGAA GCGGTGGTGT CTCACCCAGT ACCCCGCCCA GACCAACGCC 
CAGCTGGCCC AGCTCAGCAC GGAGGGCTAC GAGAACTTCG TCTGGGACGC GGTCAACAAG 
GACTGGGACG CCGTCCGCGA ACACCAGTCC CAGATGGTCG ACATCCTCGA CCCCGCCGAC 
GAGGTCCGGA TCGTCTCGGG CGACACCACC GACGTGACGA TGAGCGTCGC CGGCAACCCG 
ACGCTCAACG ACTACGGCGA GCGCAACCTC CCCGGCGGCG AGGTCTTTAC CGCCCCCGTC 
GCCGACAGCG TCGAGGGCGA GGTCCTGTTC GACAAGCCCC TGTACCATCA GGGCCGAGAA 
GTGACGGACG CATACCTCAC GTTCGAGGAC GGCGAGGTCG TCGACCACAG CGCGTCGAAA 
AACGAGGACG TGCTGACGGA AGTGCTCGAC ACCGACGCGG GCGCGCGCCG ACTCGGCGAA 
CTCGGGATCG GGATGAACCG CGACATCGAC CAGTTCACCT ACAACATGCT GTTCGACGAG 
AAGATGGGCG ACACCGTCCA CATGGCCGTC GGCCGCGCGT ACGACGACAC CGTCGGCGAA 
GACAACGAGC AAAACGACAG CGCCGTCCAC GTCGACATGA TCGTGGACAT GAGCGAGGAC 
TCGTACATCG AGGTGGACGG CGAGCGCGTA CAGGAGGACG GGACGTTCGT GTTCGAGGAC 
AACGAAATCG AGCAGTAG

Protein sequence

MDPRVREHAE IVADHSVELQ AGDDVVIDAH PDAADLVTAL HEVIADRGAN PLTVQDRLGA 
RFRRAYLRNH DGDFETPAHV QALYDEMDVY IAIRGGGNAT ETSDVDPETT AAYQQAQQPL 
LDERLSKRWC LTQYPAQTNA QLAQLSTEGY ENFVWDAVNK DWDAVREHQS QMVDILDPAD 
EVRIVSGDTT DVTMSVAGNP TLNDYGERNL PGGEVFTAPV ADSVEGEVLF DKPLYHQGRE 
VTDAYLTFED GEVVDHSASK NEDVLTEVLD TDAGARRLGE LGIGMNRDID QFTYNMLFDE 
KMGDTVHMAV GRAYDDTVGE DNEQNDSAVH VDMIVDMSED SYIEVDGERV QEDGTFVFED 
NEIEQ