Gene Huta_0741 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Huta_0741
Symbol
ID	8383011
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhabdus utahensis DSM 12940
Kingdom	Archaea
Replicon accession	NC_013158
Strand	+
Start bp	726859
End bp	727950
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	67%
IMG OID	644971804
Product	peptidase M29 aminopeptidase II
Protein accession	YP_003129659
Protein GI	257051826
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2309] Leucyl aminopeptidase (aminopeptidase T)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACGATC GCATCCACGA ACACGCCGCA GTGCTGGTCG ACTGGAGCGC ACGGATCGAG 
TCGGGTGACG ACGTCGTTCT CTCCGTGGAC GAGGGCGCAC ACGATCTCGC TGTCGCGGTC 
GCCGAAAAGC TGGGTGACCG GGGCGCGAAC CTCGTGAACG TCTATCGCTC TGACGAGATT 
CAGCGTGCAT ATCTCCAAGC GCACGACGAC GATTTTGACG ACGATCCTGA GTACGAACGC 
ACACTCTACG AGAACGCCGA CAGCGTCCTC GTGCTGAAGG GTACACGCAA CACCGCTGGA 
ATGGCCGACG TCCCCGACGA CCGCCAGCAG GCGTTTGCCC GCGCCAGAGA AGAGGTCCGG 
GAAGCGCGCC TGGCGACCGA CTGGGTCTCG ACGCTGCATC CGACCCGCGC ACTCGCCCAG 
GGGGCCGGGA TGGCGTTCGA GGAGTACCGC GAGTTCGTCT ACGACGCCAC GCTCCGGGAC 
TGGGAATCCC TCTCCGAAGA GATGGATCGA CTCAAGACGA TTCTCGACCA GGGCGACGAG 
GTCCACATCG ACGCCCCTGG CACCGATCTC ACGCTCTCGA TCGCGGGGCG GACGGCAGTC 
AACAGCGCCG CGTCGGTGGC CTACGACTCC CATAACCTCC CCAGCGGCGA GGTCTTCACC 
GCGCCCGCCG ACGCCGAGGG CGAGGTCACT TTCGACGTGC CGATGACGGT CCGGGGCAAC 
ACCCTGCGGG ACGTCCACCT CGTCTTCGAG GACGGCGACG TCGTCGAGCA CGCGGCCGCG 
GCCGGCGAGG AGACGCTGGC AGCGCTACTG GAGACCGACG CTGGCGCTCG TCGGCTCGGC 
GAGCTCGGCG TCGGCATGAA TCGCGGCATC GACCGCTACA CGGACAATAT CCTCTTCGAC 
GAGAAGATGG CCGAGACCGT CCACCTGGCG CTGGGCCGGG CCTACGACGC CTGTCTGCCC 
GAGGGCGAAT CCGGCAACGA CAGCGCGATC CACGTCGACC TGATCGCCGA CACGAGCGAG 
GACGCGACGC TGTCGGTCGA CGGCGAAGTG ATCCAGCGGG ACGGCGTCTT CCGGTGGGAA 
GACGGCTTCT AG

Protein sequence

MDDRIHEHAA VLVDWSARIE SGDDVVLSVD EGAHDLAVAV AEKLGDRGAN LVNVYRSDEI 
QRAYLQAHDD DFDDDPEYER TLYENADSVL VLKGTRNTAG MADVPDDRQQ AFARAREEVR 
EARLATDWVS TLHPTRALAQ GAGMAFEEYR EFVYDATLRD WESLSEEMDR LKTILDQGDE 
VHIDAPGTDL TLSIAGRTAV NSAASVAYDS HNLPSGEVFT APADAEGEVT FDVPMTVRGN 
TLRDVHLVFE DGDVVEHAAA AGEETLAALL ETDAGARRLG ELGVGMNRGI DRYTDNILFD 
EKMAETVHLA LGRAYDACLP EGESGNDSAI HVDLIADTSE DATLSVDGEV IQRDGVFRWE 
DGF