Gene Tpau_3893 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpau_3893
Symbol
ID	9158074
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Tsukamurella paurometabola DSM 20162
Kingdom	Bacteria
Replicon accession	NC_014158
Strand	+
Start bp	4012563
End bp	4014032
Gene Length	1470 bp
Protein Length	489 aa
Translation table	11
GC content	66%
IMG OID
Product	Terminase
Protein accession	YP_003648804
Protein GI	296141561
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGGCGG GTCCGAAGGC CGCTGTCGAC ACCTCTCCGT TGCCTTTTCG GCCGCGGTCG 
GAGGTGGAGT CGGAGCGGTT TCTTGCTTTC GCGGACAAGT TCTTGCGGGT GCCGAAGGGC 
ACGGGTGCGA AGGGGAAGCT GCACCTGCGG GACTGGCAGG TCGACGTGGC GCGGGATGTT 
CTGGACTCCG GTGCCCGGAC GGTGGGGATC ATGTTCCCTC GCGGGCAGGG CAAGACCACC 
CTGAACGCGG CGATCGCCCT GTACAGGTTC TTCACCGGCG GGGAGGGCGC GAACGTGTGC 
GTGGTCGCGG TGGATGAGCG GCAGGCCGGT CTCGCGTTCT CTGCGGCCCG CCGCATGGTG 
GAGCTCAACG AGGAACTGTC GGCGCGCTGC CAGATCTTCA AGGACCGCCT GTATCTGCCG 
ACCACGGACA GCGTGTTCCA GTGCCTGCCT GCGTCTCCGA CGGCGTTGGA GGGCCTGGAC 
TACGTGCTCG CCTTGGTCGA CGAGGCCGGC GTGGTGAACC GCGATGTGTT CGAGGTGGTG 
CAGCTCGCGC AGGGCAAGCG TGAAAAGTCC GTGTTGGTGG CGATCGGGAC GCCCGGCCCG 
AATCTGGACG ACCAGGTGCT CTTGAGCCTC CGGGATTACC ACCTTGAGCA TCCCGACGAT 
GCGTCGTTGC GGTGGCGGGA GTTCTCTGCG GCTGGTTTCG AGGATCACCC GGTGGACTGC 
ACACACTGCT GGGAGCTGGC GAACCCGGCG CTGGACGATT TTCTTCACCG GGACGCCCTG 
GTGGCCCTAC TTCCGCCGAA GACCCGTGAG AGCACCTTCA GGCGGGCGCG GTTGTGCCAG 
TTCGCGGCGG ATACGGAGGG CTCGTTCCTT CCTGCTGGCG TCTGGGAGGG GTTGTCGACG 
GGTGAGCCGG TTCCGCTGGG GGCGGAAGTG GTGATCGCGC TCGATGGATC ATTCTCGGAC 
GACACGACCG CCCTGCTGTT GGGCACGGTG GCGGCGGCAC CTCACTTCCA TCCCTTGCGG 
GTGTGGGAGC GGCCTGCCGA TAACGATGAC TGGCGGGTGC CGGTCTTGGA GGTGGAGAAC 
ACGATCCGCC AGGCGTGCCG GGACTACCAG GTGGTGGAGA TCATCGCGGA CCCGTTCCGG 
TGGACCCGCA CCCTGCAGGT TCTTGAGCAG GAGGGCTTGC CGGTGGTGGA GTTCCCGCAT 
TCGCCTTCGC GGCTGACGGC GGCGACGACG GACCTCTATA CGTCTGCGGT GAACGGCGAA 
ATCTCCCACT CAGGCGCCGC CAAGCTCGCG GCTCACGTGG CGGCGGCTGT GGTGCAGGAA 
GATCCGCGTG GGCTGCGATT GGCGAAGCGG TCGCGGTCGC GTGCAGCTCG GAAGATCGAC 
CTCGCGGCAT GTCTGGTGAT GGCACATTCG CGGGCGACGT GGCGGGCGGC ACACAGGAAG 
AAACGCCGCA CTGTCTCATT CTCAAACTAG

Protein sequence

MKAGPKAAVD TSPLPFRPRS EVESERFLAF ADKFLRVPKG TGAKGKLHLR DWQVDVARDV 
LDSGARTVGI MFPRGQGKTT LNAAIALYRF FTGGEGANVC VVAVDERQAG LAFSAARRMV 
ELNEELSARC QIFKDRLYLP TTDSVFQCLP ASPTALEGLD YVLALVDEAG VVNRDVFEVV 
QLAQGKREKS VLVAIGTPGP NLDDQVLLSL RDYHLEHPDD ASLRWREFSA AGFEDHPVDC 
THCWELANPA LDDFLHRDAL VALLPPKTRE STFRRARLCQ FAADTEGSFL PAGVWEGLST 
GEPVPLGAEV VIALDGSFSD DTTALLLGTV AAAPHFHPLR VWERPADNDD WRVPVLEVEN 
TIRQACRDYQ VVEIIADPFR WTRTLQVLEQ EGLPVVEFPH SPSRLTAATT DLYTSAVNGE 
ISHSGAAKLA AHVAAAVVQE DPRGLRLAKR SRSRAARKID LAACLVMAHS RATWRAAHRK 
KRRTVSFSN