Gene Tpau_4179 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpau_4179
Symbol
ID	9158367
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Tsukamurella paurometabola DSM 20162
Kingdom	Bacteria
Replicon accession	NC_014158
Strand	-
Start bp	4301899
End bp	4303089
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	70%
IMG OID
Product	transcriptional regulator, TetR family
Protein accession	YP_003649087
Protein GI	296141844
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACCCAGG CGCGGAGGAA GCGGCCCAAG GACCGGCGCG AGCAGATCGC GCGGGTGGCT 
GCAGAGGACT TCTCCCGGCG CGGCTACCAC GGTGTGGGCA TCGAGCAGAT CGCGGCATCC 
CTCGACATCT CGGGTCCGGC TGTGTACCGG CACTTCCCGA ACAAGTACGC ACTGCTCGAA 
CACGCGATCA CCTCGGCGTC GGACGCCCTG AGCGCGGCTG TCGCACAGGC GGCGCAGGAG 
ACGGAGGGAC AGGACGCGGA AGCACGCATC GATGCCATCG AGGACGCGGC GCTGCGAGTG 
GCCTTCGAGC GTCGCAACAC CGGTGGCCTG TTCCGCTGGG AGCAGCGACT CCTGGAGCGG 
CAGGATCGGA ATCGGATCCG GGACCAGTTG ACGCAGATGA TCGGCACCTT CGCGGATGCC 
GCTGAACCCG CCCTTCCGGG GGTGGGCCGT GCGGAGCGCG AGCTCCGTTG CGTCGGTGTC 
ATCAGTGTCA CCGGAAGCGT GACCGCACAC CGCACGGTGC TCGCGCAGAG GCGCGCCGAA 
GCAGTGCTCA GGACCGCGGG CCGGAGGTTG CTGGCGCTGC CCGCCCCGCC CACCGAGTAC 
GTCCTCGCTC CGCCGCCGTC CTCCGTGGCG GGGACGGACG CGGGCCGTCA GGAGCAGGTC 
CTCGACGAGG CCGTGGAGCT GATCTTCAGC CACGGATTCC ACAACGTGAG CATGGGGCAG 
ATCGGTCAGG CGGCCGGCAT CGTTCCGTCC GGGATGTACC GGTACTTCCC GAACAAGGCC 
GGGATCCTCG TGCGCGCGCT CGAACGATCC GGCGCGGCGA TGGTCGATGC GATCGCCGCG 
GTGGTCGAGG CGAACCCCGA ACCCCGGGCC CGGCTCGCCG CCCTCGCGCA GGCCTACGTC 
CAACTGTCCT TCGGGCAGTC GAAGTTGATG ACGGTCTACT TCCGCGAGAT CGGCAACGTG 
CCGGACTCCG ACCGCAGCCG TCTCGCGAGC GTGCAGCGCG CCAACATCGC CGCGTTCGCC 
GATGCCGTGA TGGCCGTGCG TCCGGATCTG GGTGCGGCCG AGGCCACGTT CCTCGTCCAC 
GCGGCCTTCG CCGTGGTCTT CGACGTCGGA CGCACCCGCC GCTTCGACGC CGACCCGCAC 
TTCCAGGCCG AGGTCTTCGC GATGGTGTGC GCGGTGCTCT TCGATTCCTA G

Protein sequence

MTQARRKRPK DRREQIARVA AEDFSRRGYH GVGIEQIAAS LDISGPAVYR HFPNKYALLE 
HAITSASDAL SAAVAQAAQE TEGQDAEARI DAIEDAALRV AFERRNTGGL FRWEQRLLER 
QDRNRIRDQL TQMIGTFADA AEPALPGVGR AERELRCVGV ISVTGSVTAH RTVLAQRRAE 
AVLRTAGRRL LALPAPPTEY VLAPPPSSVA GTDAGRQEQV LDEAVELIFS HGFHNVSMGQ 
IGQAAGIVPS GMYRYFPNKA GILVRALERS GAAMVDAIAA VVEANPEPRA RLAALAQAYV 
QLSFGQSKLM TVYFREIGNV PDSDRSRLAS VQRANIAAFA DAVMAVRPDL GAAEATFLVH 
AAFAVVFDVG RTRRFDADPH FQAEVFAMVC AVLFDS