Gene Tcur_4004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tcur_4004
Symbol
ID	8605360
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermomonospora curvata DSM 43183
Kingdom	Bacteria
Replicon accession	NC_013510
Strand	-
Start bp	4570538
End bp	4571737
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	75%
IMG OID
Product	carboxyl-terminal protease
Protein accession	YP_003301571
Protein GI	269128201
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCCGGA TCACCGGTCG TGTCCCCCGA GGCTTTCGCG CCGGTGGATT CACCCGTGGT 
GCGGCATTGA TCACGGTGGT GCTGTGCGTT TACGGCGCCG GCGTGGTGAC CGGCGCCGAG 
GCGCCCTCCT CCTCCACCCG GCCCCAGCGG GGGCCGCTGG ATGAGGCCGC CGAACGGATC 
GCCGAGGAGT CGGCCCTGCC GGTCGACCGC GCCGAGCTGC AGCGCGCCGC GGTGAACGGG 
ATGCTGCAGC GGCTCGGCGA CCGCTGGGCC CGCTACTACA CCGCGACGGA GTACGACGAC 
ACCCGTGGCC GGCTGAACGG GCGCTATAGC GGCGTCGGGC TGTGGCTCGG CGTCGAGGAA 
GGGTCCGGAC GGGTCCTGGT GGCCAGCGTT CAGCCGGAGT CGGCCGCCGA ACGCGCCGGA 
GTCCGGGTCG GCGACGCCAT CACCGGGATC GGCGACCGCA AGGTCGGCGG ATGGACCGTG 
AGCAAGGTCG CCGCCGCGCT GCGCGGCGCC CCCGGCACCT CGGTGACGCT CACCGTGCTG 
CGGAAGGGCG CCGAGCGCCA CTTCACGCTG GTGCGCTCGG CCGTGCAGAC CGGCGATGTG 
ACCGTGGAGC AGCGTTCCGG CAGCATTCGG GTGATCCGGG TGGCGGCGTT CACCCGCGGG 
GTGGGCCGGC AGGTGCGCGA GGCCGTCGAG CGGCCGGCCG GCGGCGCGGA GTCCGGGCTG 
ATCCTGGATC TGCGCGGCAA CCCGGGCGGG CTGCTGGAGG AGGCGGTGGA GACCTCCTCG 
GCGCTGCTGA GCGACGGGGT GGTCGCCGTC TATGAGCGGC GCGGCGAGCG GCCCCGGGAG 
CTGCGCGTCA CCGAGCCGGG GGACGGCCGC ACCCCGCTGG TGGTGCTGGT GGACGCCGGA 
ACCGCCAGCG CCGCCGAGGT GGTCGCCGGT TCCCTGCGCG ATCGCGACCG CGCCGTCCTC 
GTAGGATCCC GTACCTATGG GAAGGGGTCG GTGCAGGAGC CGGTCCGGCT GCAGGACGGC 
TCGGTGATCG AACTGACCGT GGGGCGCTAC CGCACCCCCG GTGGCCGTGA CCTGGACGGG 
ACCGGGATCG AGCCCGATGT GGCCGTCTCG GCCGACCGCC CCCCCGAGGA GGCCCTGGAA 
CGCGCGGGCG CGGTGCTGCG CGGGCTGATG GCCTCCGCGT CCACCAAGGA TCGACGCTAG

Protein sequence

MLRITGRVPR GFRAGGFTRG AALITVVLCV YGAGVVTGAE APSSSTRPQR GPLDEAAERI 
AEESALPVDR AELQRAAVNG MLQRLGDRWA RYYTATEYDD TRGRLNGRYS GVGLWLGVEE 
GSGRVLVASV QPESAAERAG VRVGDAITGI GDRKVGGWTV SKVAAALRGA PGTSVTLTVL 
RKGAERHFTL VRSAVQTGDV TVEQRSGSIR VIRVAAFTRG VGRQVREAVE RPAGGAESGL 
ILDLRGNPGG LLEEAVETSS ALLSDGVVAV YERRGERPRE LRVTEPGDGR TPLVVLVDAG 
TASAAEVVAG SLRDRDRAVL VGSRTYGKGS VQEPVRLQDG SVIELTVGRY RTPGGRDLDG 
TGIEPDVAVS ADRPPEEALE RAGAVLRGLM ASASTKDRR