Gene Dgeo_0071 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dgeo_0071
Symbol
ID	4058512
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Deinococcus geothermalis DSM 11300
Kingdom	Bacteria
Replicon accession	NC_008025
Strand	-
Start bp	68257
End bp	69522
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	69%
IMG OID	641229067
Product	peptidase M29, aminopeptidase II
Protein accession	YP_603543
Protein GI	94984179
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2309] Leucyl aminopeptidase (aminopeptidase T)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCCCTT CCTCCTTTGA TGACAAGCTC GCTCGCTATG CCGAACTCCT CGTCCGGATC 
GGCGTGAATC TGCCGGAAGG CGGGAAGGTG CGGATCCATG CCCCCATCGA GGCCGCGCCG 
CTGGTGCGGC TGGTGGCCCG TGCCGCGTAC CGGGCAGGCG CCGCCGACGT GCGCGTGGGG 
TACCGCGACG ATCACCTCGA TCGAGCGCTC TACGAGGACG GCAGCGACGC GGCGGTGGAC 
TTTCTGCCGG AATGGCTCGC GCAGGAGCAG GCGGCGATGG TGGCGGACGG CTACGCCTTT 
ATCTCCATCG TGGGGGAAGA CCCCTCGCTG CTGGCGGGCG TGAACCCGGA CCGGGTCGCG 
CGGCGCAGCA AGGCCCTTGC CGCGGCCCGG CGGGAGGTCA GCGAGGCCAT CAGCGGTATG 
AAGGTGAACT GGACTGTCGC CGGGATGGCG ACCCCAGCCT GGGCGCGCCG CGTCTTTCCC 
CAGCTGCCGG AAGAGGCAGC AGTGGCCCGG CTGTGGGACG ACATCTTCAA AGTGACCCGC 
GCCGACCAGC CCGACCCGGT GGCGGCTTGG GACACGCACC TTTCCAGGCT GGAGCACCTC 
ACCGAGTATC TGAATGAGAA ACAGTACACG GCCCTTCACC TCCGCAGCGG CCTGGGCACC 
GACCTCACGG TGGGGCTGGC CGAAGGGCAT ATCTGGCAGG GCGGCGCGGA AACGGCGAAA 
AACGGCATCC GGGCCGTGCC CAACCTCCCC ACCGACGAGG TCTTTACCGC CCCGCACCGT 
GACCGGGTGG ACGGCGTGGC GGTGGCGAGC AAGCCGCTGA GCGTACGCGG ACAACTCGTC 
GAGGGCATCC GTGTGCGTTT CGAAGGCGGA AAGGCCGTCG AGGTTCGCGC GGAGCAGGGC 
GAGGAGACGC TGCGGCAACT GCTGGCGACG GACGAGGGCG CCGCCCACCT GGGTGAGATC 
GCGCTGGTGC CCGCCTCGGC CCCCGTCGCG CAGACCGGGA CGCTCTTCCT GAACACCCTC 
TTCGACGAGA ATGCCGCCTC CCACATCGCC CTGGGGCGCT GCTACCCCAC CAATGTGCAG 
AACGGCGAGA ACCCAGAAGC CCTGCGGGCG GCGGGCGGCA ACGACTCGCT CATCCACGTG 
GACTGGATGA TCGGCACCCC CGATATGGAT GTGGACGGCA TCACGGCGGA CGGCAAATGC 
GAAGCGCTGA TGCGCGGGGG CGAATGGGTG GTGGGCGAGC GTTCAGCGGC TGAGGCCAAG 
GCTTAA

Protein sequence

MSPSSFDDKL ARYAELLVRI GVNLPEGGKV RIHAPIEAAP LVRLVARAAY RAGAADVRVG 
YRDDHLDRAL YEDGSDAAVD FLPEWLAQEQ AAMVADGYAF ISIVGEDPSL LAGVNPDRVA 
RRSKALAAAR REVSEAISGM KVNWTVAGMA TPAWARRVFP QLPEEAAVAR LWDDIFKVTR 
ADQPDPVAAW DTHLSRLEHL TEYLNEKQYT ALHLRSGLGT DLTVGLAEGH IWQGGAETAK 
NGIRAVPNLP TDEVFTAPHR DRVDGVAVAS KPLSVRGQLV EGIRVRFEGG KAVEVRAEQG 
EETLRQLLAT DEGAAHLGEI ALVPASAPVA QTGTLFLNTL FDENAASHIA LGRCYPTNVQ 
NGENPEALRA AGGNDSLIHV DWMIGTPDMD VDGITADGKC EALMRGGEWV VGERSAAEAK 
A