Gene Huta_0500 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Huta_0500
Symbol
ID	8382767
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhabdus utahensis DSM 12940
Kingdom	Archaea
Replicon accession	NC_013158
Strand	+
Start bp	505330
End bp	506508
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	66%
IMG OID	644971562
Product	peptidase M24
Protein accession	YP_003129420
Protein GI	257051587
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGCCAG ATCTTTCTGC AGTCGACGAA CGGCTGGCCG AGTTCGAGGC CGACGGATAT 
CTCCTTGATG CCGATGGAAC CGACCCGAAC CAGCAGTATC TCTCCGGGTT TGACGCCCCC 
GATCCGTTCG TGACGCTGTA CGCTGGGGAG ACGCATCTCC TGTTTGTCCG GAGTCTGGAG 
TTCGGCCGCG CAAAGCGGGA GGCGCGTGCC GACACCGTCG AACGGTTCGT CGACTTCGAC 
TACGACCGAC TTCGCGAGGA ACACGACCGT CGTGAAGCGG CCGCCCGCGT TCGCGCCACG 
TTCCTTCGTG AGCACGATGT CGAGCACGTC GCCGTCCCGC CGCGGTTCCC GACGGGAACG 
GCCGACGCAC TGCGCGAACA GAACATCGAG GTCACGGTCG ATCACGACGA CGCGATCGAG 
ACCGCTCGGG CGACGAAGAC CGCCGCGGAG ATCGACCATA TCCGGACTGC CCAGCGAGCC 
AACGAGGCCG CGATGGCGGC CGCCGAGGGC CTCATCAGGG GAGCCGCTGT CGACGACGAG 
GGGCGACTGC TCGCCGAAGG TGAGGTGTTG ACCAGCGAAC TGGTCCGCGA GGAGATCGAA 
GTAACACTGC TCCGGAACGG CTGTGCGCTC GACGAGACGA TCGTCGCCTG TGGCGCGGAC 
GCCGCCGATC CCCACGATCG CGGAAGCGGC CCCCTCGTGG CCGACGAGCC CATCATCGTC 
GACATCTTCC CCCAGGACAA GGACTCAAAA TACCACGCCG ACATGACCAG GACGTTCCTG 
GTCGGCGAAC CGGACGAGAC GGTCGAGGAG TGGTTCGAGC TGACCGATCA GGCTCGTAAG 
GCAGCCATCG ACGCGGTCGA ACCGGGCGTC ACGGGCGCCG AAGTTCACGA TATCGTCTGT 
GACGTCTACG AGGACGCCGG CCTGCCGACG CTCCGGAGCG ACGGGAGCGC CGAGACGGGA 
TTCATCCACT CGACCGGCCA CGGCGTCGGG CTGGCAGTCC ACGAACAGCC GAGCGTGAGC 
CAGCGCGGCG GGGAACTCGA ACCGGGCCAC ATCATTACGA TCGAGCCCGG CCTCTACGAT 
CCGGCGGTCG GCGGCGTCCG GATCGAGGAT CTGCTGGTCG TGACCGACGA CGGTGCGGAG 
AACCTGACCG AGTACCCGGT GGCACTCACC GGGGAGTAA

Protein sequence

MEPDLSAVDE RLAEFEADGY LLDADGTDPN QQYLSGFDAP DPFVTLYAGE THLLFVRSLE 
FGRAKREARA DTVERFVDFD YDRLREEHDR REAAARVRAT FLREHDVEHV AVPPRFPTGT 
ADALREQNIE VTVDHDDAIE TARATKTAAE IDHIRTAQRA NEAAMAAAEG LIRGAAVDDE 
GRLLAEGEVL TSELVREEIE VTLLRNGCAL DETIVACGAD AADPHDRGSG PLVADEPIIV 
DIFPQDKDSK YHADMTRTFL VGEPDETVEE WFELTDQARK AAIDAVEPGV TGAEVHDIVC 
DVYEDAGLPT LRSDGSAETG FIHSTGHGVG LAVHEQPSVS QRGGELEPGH IITIEPGLYD 
PAVGGVRIED LLVVTDDGAE NLTEYPVALT GE