Gene Nther_1004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nther_1004
Symbol
ID	6316569
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natranaerobius thermophilus JW/NM-WN-LF
Kingdom	Bacteria
Replicon accession	NC_010718
Strand	-
Start bp	1067583
End bp	1068764
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	38%
IMG OID	642643376
Product	isoaspartyl dipeptidase
Protein accession	YP_001917176
Protein GI	188585631
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR01975] isoaspartyl dipeptidase IadA

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTACTT TAATACGCGG AGGACAGCTT TACACACCTG AGTATCAAGG TAAAAAAGAT 
GTCCTGTTAA CAGGTGAAAA AATTGCTTAC ATCGATGACA ATATCAACTT ACAATCTCCT 
TCCTCACAAG ATGGAATTGT AGAAGAAATT GATGCTCGCG GCAAATTTGT TGTGCCAGGT 
TTTATAGATG GTCATGTCCA TCTCATTGGT GGTGGTGGCG AAGGTGGCTT CGCCACCCGA 
ACCCCTGAAA TTGAACTTTC TAATATTATA ACTTCTGGAA TTACCACTGT TATTGGATGT 
CTCGGTACTG ACGGTATCAC CCGAGAAATG AAAGACCTCC TAGCAAAAGC ACGTGGACTA 
AGAGAAGAAG GAATTTCTAC ATATATCTTG TCCGGATCAT ATAAAGTGCC TGTAACAACC 
TTAACCGGTG AAGTACAAAA GGATATTGTT TTAGTTCCAG AAGTTCTTGG TGTAGGAGAA 
ATAGCTTTAT CAGATCATAG ATCCTTCGAA CCAACAATAT CCGAATTGAA AAAATTGGTT 
GCAGAAACCA GAGTAGCAGC TATGTTATCC GGTAAAAAAG GTATCATAAA CGTACACATG 
GGCGATGGAG TTAAAATGTT CCAAGATATT GACAGAATAA TTGAAGAAAC TGAGCTTCCC 
GGTTCTCACT TTGTTGTGAC TCATGGCAAT CGAACCCAAG GCTTATTCAA TGAAGGATTA 
GAATTAACCC AAAAAGGAGT CTTTTTAGAC TTAACGACTA GTACAGTACA GAAATTCATA 
GAAGACGGTG AAATCAAGTG TTCCCGAGCG CTAAAATATT TTGATGATAA TGGGATAACG 
CCAGACAACG TAACGTTTTC TTCTGACGGT CAAGGTAGTC TTCCGAATTT TAGTGAGTCT 
GGAGATTATT TAGGCTTAAA AGTCGGAGGT GTAGAATCAC TATATAGAGA AGTTAAAGAA 
GCTGTCACTG AGGAAAATGT ACCCTTAGAA AATGCTCTCA GGGTCATCAC AAAAAATCCA 
GCTTCTGCAT ACGGACTAAA CAACAAAGGA GAACTAACAA AAGGTAAAGA TGGTGACTTA 
ATACTACTCG ATGAAGATAC TTTAGAAATC GATACAGTTA TCTCCCGAGG AAAAACATTA 
ATTAAAAATA AAGAAATTTT GCAAAAAGGT ACCTTCGAAT AA

Protein sequence

MVTLIRGGQL YTPEYQGKKD VLLTGEKIAY IDDNINLQSP SSQDGIVEEI DARGKFVVPG 
FIDGHVHLIG GGGEGGFATR TPEIELSNII TSGITTVIGC LGTDGITREM KDLLAKARGL 
REEGISTYIL SGSYKVPVTT LTGEVQKDIV LVPEVLGVGE IALSDHRSFE PTISELKKLV 
AETRVAAMLS GKKGIINVHM GDGVKMFQDI DRIIEETELP GSHFVVTHGN RTQGLFNEGL 
ELTQKGVFLD LTTSTVQKFI EDGEIKCSRA LKYFDDNGIT PDNVTFSSDG QGSLPNFSES 
GDYLGLKVGG VESLYREVKE AVTEENVPLE NALRVITKNP ASAYGLNNKG ELTKGKDGDL 
ILLDEDTLEI DTVISRGKTL IKNKEILQKG TFE