Gene Tpau_1101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpau_1101
Symbol
ID	9155241
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Tsukamurella paurometabola DSM 20162
Kingdom	Bacteria
Replicon accession	NC_014158
Strand	-
Start bp	1127416
End bp	1128975
Gene Length	1560 bp
Protein Length	519 aa
Translation table	11
GC content	70%
IMG OID
Product	peptidase S1 and S6 chymotrypsin/Hap
Protein accession	YP_003646072
Protein GI	296138829
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGACGAC TGGTCATCAT CCTCATCGGA ACAGCACTGT TGGCCCTCGC CGGCGGACCG 
CCGGCGGGGG CGATCATCGG CGGGAAGGTC GCCCCGGAGG CGCCGCCGTC CCTTGGCTCT 
CTGCAGGTCG AGCTGCCCGG CGATGCGGTG ACCCCCGATA ACCACCGCTG CGGCACGACG 
CTGATCGCAC CGCAGTGGGT GGTCACCGCG AGCCACTGCG CGATCCTCGG CAACGCCGGC 
GATGCGGCCA CCGGCCCGAT GCGCGCCTCC GTGCGGATCG GGTCGACGAA CACGGGCACG 
GGCGGTGAAC TGGTGGGTGT CGATCGCTTC TATCGCCTGG GCACCCCGAC CGAAGCGCGC 
GAAGACGGAT ACGACTGGCT GCTCCGCGAT ATCGCGCTGC TACGGCTCGA ACGACCGGTG 
CGTGCCACCC CGATCCCCAT CGCATCGAAG ACCCCCGCCG CGGGCACGCC CGCCCGGATC 
ATGGGGTGGG GCTCCACGTG TTCGGATCCG GCGAAGATGC GTGATCCCCA GTGTTATCCG 
AGCGAGCTCC GCACCGCCGA GACCGCAGTG CAGGATGCCC GCGCCTGCCC GAACATCCAG 
GGCTCGGATA CGCCGCGCCC GCTGTGCATC GGCGGCAAGG ACGGGCGGCC GACCATCGGC 
AACGCCGATT CCGGCTCGCC GGCCCTGGTG CAGGAGAACG GCGCATGGGT CATCGCGGGC 
GTGGTCAGCG GTCCGGGCAC GAACGACGAC AAGGGGCCCG GTCTCTACAT GGACCTCACC 
CAGCAGCGGG ACTGGATCGA CAGCATCATC AACAACACGA TCGTCCCCGA CGCGCCGCCG 
ACCCCGGACG TCGCCGGCGC GGTGCTCCTG GGCAACTGCA TCGGCTCGAT CGTGCGGCCG 
CCCGGGGCCA CTCCGGATGC CCCCGCCATG GTGCTCACCA ATGGGCACTG CGTCAGCGGC 
GACCGGCCGG CGCCGGGTGG GGCAACGGTG AACCAGCCCT CGAACCGCAC CATGCTGGCG 
GCGGGCCGCA CCGGCGAGTC GGTGACCACG GTGCGCGCCG ATCGTCTCGT CTACGCCACC 
ATGAGCCGCA CCGATGTCGC GGTCTACCGC CTCGACTCGA CCTATGCCCA GGTGGCCGCG 
CGCGGCGCCA CCGTCTTCGA TCTCGCGACG ACACCCATCC GTCCCGGAGA TCGGTTCTCC 
ATGAACACCG GTGCCGCACG CAAGTCCTGT TCGGCCGAGG CCGTGGTACC GACTGTGCGA 
GAAGGCGACT GGGAACAGCG AGACTCGGTG CGGTATCGGG ACTGCTCGTC GGTGCCCGGC 
GAGTCCGGAT CGCCGCTGAT CTCACCCGAC GGCCGCACCG TGGTCGGCGT CAACAACAGC 
TCCAACACCG ACGGCGAGAA GTGCACCGAC GACAACCCGT GCGAGATCGC GGCCGACGGC 
ACCGTGACCG CGGTCAAGGG GCGCTCCTAC GGCCAGCAGA TCGACGCGCT CGCACGGTGC 
CTGACCCGGG ACTCGATCGA CCTCTCCCGG CCCGGTTGCG ACCTACCAGG TGCGGCCTGA

Protein sequence

MRRLVIILIG TALLALAGGP PAGAIIGGKV APEAPPSLGS LQVELPGDAV TPDNHRCGTT 
LIAPQWVVTA SHCAILGNAG DAATGPMRAS VRIGSTNTGT GGELVGVDRF YRLGTPTEAR 
EDGYDWLLRD IALLRLERPV RATPIPIASK TPAAGTPARI MGWGSTCSDP AKMRDPQCYP 
SELRTAETAV QDARACPNIQ GSDTPRPLCI GGKDGRPTIG NADSGSPALV QENGAWVIAG 
VVSGPGTNDD KGPGLYMDLT QQRDWIDSII NNTIVPDAPP TPDVAGAVLL GNCIGSIVRP 
PGATPDAPAM VLTNGHCVSG DRPAPGGATV NQPSNRTMLA AGRTGESVTT VRADRLVYAT 
MSRTDVAVYR LDSTYAQVAA RGATVFDLAT TPIRPGDRFS MNTGAARKSC SAEAVVPTVR 
EGDWEQRDSV RYRDCSSVPG ESGSPLISPD GRTVVGVNNS SNTDGEKCTD DNPCEIAADG 
TVTAVKGRSY GQQIDALARC LTRDSIDLSR PGCDLPGAA