Gene Tpau_3341 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpau_3341
Symbol
ID	9157515
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Tsukamurella paurometabola DSM 20162
Kingdom	Bacteria
Replicon accession	NC_014158
Strand	+
Start bp	3441246
End bp	3442472
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	69%
IMG OID
Product	HNH nuclease
Protein accession	YP_003648264
Protein GI	296141021
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0650205
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGAGCATG GATGGGGAGT ACGAATCAGG TTCAGCTGCA ACAGGAGCGG CGATGCCATT 
GCCGGTTTGG GTGCGTTGGA GCGGGCTCGT GCGCGGGTGG TGTTCGATCA GTATCGGTTG 
ATCGCCGAGT TGTTGCGAGT GCGGGTGTGT GAGCGGATCG CGGCCGGGGT GGCGCAGGAC 
CGGTGGGAGG CGGGGGTGGC GGCGGAGGTC GCGTTGGCGT TGCGGGTGTC GCCGCATCGG 
GCTGCGGGGA TGCTGTCGCG GGCTCGGACG CTCGTGAAGG ATCTGCCGGC GACGTTCGGG 
CGGCTGCGCG ACGGTGATGT TTCGCCGGAG GCGGTGGAGG TGATCCTCGC TGGCCTCTCC 
CATCTGGAGC CACGGCTGAA GTCCAAGGCC GATGCGGAGT TGTGCGGCGA ATCTTTCGCC 
GCCGCCGGTT TGGGCGTGAA GCGGTTGCAG GATCAGGTCA AGCAGGTCGC GTACCGGCTC 
GACGCCCAGG CCACCGTGGA TCGTGCGGCG CTGGCAGCGA AGGATCGTCG GGTGACGATC 
CGGCCGGCGC CGGATTGCAT GGCGCGGGTA TCGATCCTGC TGCCGGTCGC CCAAGCGGTC 
GGTGTGTACG CCGCCGTGAA GGCCGCCGCC GATGCTGCGG TCGGCACTCC CGGCGAACCA 
CGCAGCCGAG CCCAGATCAT GGCCGATACC GCCTTCGCGC GGATCACCGG CCGCGAGGCG 
GCAGAAGGGC AACCGGTGAC GGTGCACCTG ACCGTCCCTG CCTCTGTTCT GCTGGGCGAT 
CAGCCTGGCA CCGCGCACCT CTCCGGCGGC GGCACGCTGC CCGCGGAGAT CGCGCGGCAT 
CTGGTCGGGC GGGCGTCGGA GCACGCGGTC GCGTGGGTCA AACGGCTGTA TGTGCAACCG 
GAGTCGGGTG CCGTCGTCGG GCTGGATTCC CGGTCACGAC TGTTCCCTTC CGGACTCGCC 
GAGTTGATCG CGGCGCGGGA TCGGTACTGC CGGACCCCGT ACTGCGATGC ACCGATCGCG 
CACACCGACC ACGTCACCGC GCACGCCCAC GGCGGCGCAA CCAGCCTGGA CAACGGGCAA 
GGATTGTGCG CGGCCTGCAA CTACGCCAAA GAAGCAACAG GGTGGACCAG CCGCACCGTC 
CACGACGACA GCGGACGGCA CACCGTCGAA ACCCGCACCC CGACAGGACA TCTCCACCGA 
TCCACCGCAC CACCGCAGGC GGCGTGA

Protein sequence

MEHGWGVRIR FSCNRSGDAI AGLGALERAR ARVVFDQYRL IAELLRVRVC ERIAAGVAQD 
RWEAGVAAEV ALALRVSPHR AAGMLSRART LVKDLPATFG RLRDGDVSPE AVEVILAGLS 
HLEPRLKSKA DAELCGESFA AAGLGVKRLQ DQVKQVAYRL DAQATVDRAA LAAKDRRVTI 
RPAPDCMARV SILLPVAQAV GVYAAVKAAA DAAVGTPGEP RSRAQIMADT AFARITGREA 
AEGQPVTVHL TVPASVLLGD QPGTAHLSGG GTLPAEIARH LVGRASEHAV AWVKRLYVQP 
ESGAVVGLDS RSRLFPSGLA ELIAARDRYC RTPYCDAPIA HTDHVTAHAH GGATSLDNGQ 
GLCAACNYAK EATGWTSRTV HDDSGRHTVE TRTPTGHLHR STAPPQAA