Gene Tpet_1019 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpet_1019
Symbol
ID	5171153
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermotoga petrophila RKU-1
Kingdom	Bacteria
Replicon accession	NC_009486
Strand	+
Start bp	1047920
End bp	1049080
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	50%
IMG OID	640563537
Product	amidohydrolase
Protein accession	YP_001244613
Protein GI	148270153
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1228] Imidazolonepropionase and related amidohydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.18735
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGTGA AGATTCTCTT TAAAAACGCC ACGGTCTTTC CCATAACTTC CAGACCCTTC 
AAAGGAGATG TGCTTGTCTC GAACGGAAAA GTGGAAAAGT TGGGAGAAAA CATAGAAGAT 
CCCGACGCGG AAATCGTTGA TCTGACGGGA AAATTCCTGT TTCCTGGTTT CATCGACGCG 
CACTCCCACA TCGGGCTCTT TGAGGAAGGA GTAGGGTACT ATTACAGTGA TGGAAACGAA 
GCTACGGATC CCGTCACACC GCATGTGAAA GCACTCGATG GTTTCAATCC GCAGGATCCG 
GCCATAGAGC GGGCTCTTGC CGGTGGAGTC ACATCCGTGA TGATCGTTCC TGGAAGCGCC 
AACCCGGTGG GTGGACAGGG AAGTGTGATA AAGTTCAGGT CCATAATTGT GGAAGAGTGC 
GTTGTGAAGG ATCCCGCAGG TTTGAAGATG GCGTTCGGAG AAAATCCAAA GAGGGTCTAC 
GGTGAGAGGA AACAAACTCC TTCAACGAGA ATGGGAACAG CGGGAGTGAT CAGAGACTAC 
TTCACTAAAG TGAAGAATTA CATGAAGAAA AAGGAACTCG CCCAGAAAGA AGGAAAAGAA 
TTCACCGAAA CCGACCTGAA AATGGAAGTC GGCGAGATGG TCCTCAGAAA GAAGATTCCT 
GCCAGAATGC ACGCCCACCG AGCGGACGAC ATCCTCACCG CCATCAGAAT AGCAGAGGAG 
TTCGGTTTCA ACCTCGTCAT AGAACACGGA ACGGAAGCGT ACAAGATTTC TAAGGTGCTA 
GCGGAGAAAA AGATACCCGT CGTTGTGGGA CCACTCCTCA CCTTCAGAAC AAAGCTGGAA 
CTGAAAGATC TGACGATGGA AACTATCGCA AAACTCCTGA AAGATGGGGT TCTTATAGCC 
TTGATGTGTG ATCACCCGGT GATTCCTCTC GAGTTTGCAA CCGTTCAGGC GGCAACTGCC 
ATGAGGTACG GTGCAAAGGA AGAAGATCTG CTGAAGATCC TGACGGTGAA TCCTGCTAAG 
ATCCTCGGCC TCGAAGATAG AATCGGTTCC ATTGAACCTG GAAAGGACGC GGATCTTGTG 
GTCTGGAGCG GACATCCGTT CGATATGAAA TCCGTGGTGG AAAGGGTTTA CATAGACGGA 
GTGGAAGTCT TCAGAAGATG A

Protein sequence

MSVKILFKNA TVFPITSRPF KGDVLVSNGK VEKLGENIED PDAEIVDLTG KFLFPGFIDA 
HSHIGLFEEG VGYYYSDGNE ATDPVTPHVK ALDGFNPQDP AIERALAGGV TSVMIVPGSA 
NPVGGQGSVI KFRSIIVEEC VVKDPAGLKM AFGENPKRVY GERKQTPSTR MGTAGVIRDY 
FTKVKNYMKK KELAQKEGKE FTETDLKMEV GEMVLRKKIP ARMHAHRADD ILTAIRIAEE 
FGFNLVIEHG TEAYKISKVL AEKKIPVVVG PLLTFRTKLE LKDLTMETIA KLLKDGVLIA 
LMCDHPVIPL EFATVQAATA MRYGAKEEDL LKILTVNPAK ILGLEDRIGS IEPGKDADLV 
VWSGHPFDMK SVVERVYIDG VEVFRR