Gene Tfu_0221 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tfu_0221
Symbol
ID	3578934
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermobifida fusca YX
Kingdom	Bacteria
Replicon accession	NC_007333
Strand	-
Start bp	249369
End bp	250619
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	71%
IMG OID	637683905
Product	subtilisin-like serine protease
Protein accession	YP_288282
Protein GI	72160625
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1404] Subtilisin-like serine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTGCACGA CACGGGGTTG GACTCCCGCC GCGCTGGCTC TCTGCTCGGC GCTCGCTGTC 
GGCCTGTCCG CCGCACCGGC AGCAGCCGAC GTTTCCGACC TGCGTCTTGA ACAGTGGGGC 
CTGGACATGG TCGGTGCGGC CGAGGTGTGG GAGGAAGCCC AAGGCTCCGG GGTGACGGTT 
GCCGTGCTCG ACACCGGTGT TGTCACCGAC CACCCCGACT TGAAGGACGT CACCGTCGGC 
CCCGACTTCA CCGGTCACGA CCTGTCCTCA GACAGCGACG GCTACGGGAT CCACGGCACG 
ATGATGGCCG GAATCGTGGC GGCCAGCGGG CACGGTGTCG AACACACCGG CGGTGTGATG 
GGAGTGGCCC CCGAAGCAGA GATCCTGGCG ATCCGCATCA CCGCGGAACC GGACGGCCCT 
GACCGGGACA GTGTGGACCC GGGGGCCTTG GCCGCAGGCA TCCGCTACGC CGTGGACGAA 
GGCGCCCAGG TGATCTGCCT GCCCTTGGCT GGCGCAGAGT TCTCCGTCCA AGCCAACGAA 
GCAGACCAGG AGGCCATCGC CTATGCGGTG AACCACGGGG TGGTAGTCGT CGCCTCCGGC 
GGTCCCCTCG GGGAGGCCAG CTACCCGGCC GCCTACCCGG GCGTGCTTGC CGTCGGCTCG 
GTCGGCCCCG ACGGGTCCCT CTCCGAGTTC TCCAGCCGGG GCGACCACAT CGCGGTGACC 
GCCCCGGGCG AGGAGATCAC CGTGGTGGAC CCGGACGGCG GCTACACCAC AGTCTCCGGA 
AGCGACGCGG CCGCGGCGTT CGTCGCGGGC GTGGCCGCGC TGATCCGCGG CGAGTTCCCG 
CAGTTGAAAC CGGAGCAGGT GGTGGAGGCG ATCACCTCGG GCGCGCAGGC TGCCGACCCT 
GCCGCAGCGG GGCAGCCCGG CTACGGAGCC GGAGTGGTGA ACGCGCCGGA CGCGTTCACC 
ACGGCCAAGT CGACCGCGGA CCACGTGCCG CCGTTCGACC CGGAGCTGGC CGAGCAGCTC 
GAGGAAGAGC CGCTCATCCC CTACTGGATG CTGTGGACGG GCGGGGCTGT GCTCCTCATC 
GTCGCGGCCG TGGTGGCAAT GGTGGTCGCC CACCGGCGCG CCGCCGACCC CTACGGTTTC 
GGCAAGCGGA AGCCGGAAGA ACCGGAAGAG CCGGAGCCCG TACCGACCGC GCGGCGCCCG 
GTGCGGGGCC GTCGGCGCCG CGGACGCGGA CGGCGCGGTG TCAGTAGGTG A

Protein sequence

MCTTRGWTPA ALALCSALAV GLSAAPAAAD VSDLRLEQWG LDMVGAAEVW EEAQGSGVTV 
AVLDTGVVTD HPDLKDVTVG PDFTGHDLSS DSDGYGIHGT MMAGIVAASG HGVEHTGGVM 
GVAPEAEILA IRITAEPDGP DRDSVDPGAL AAGIRYAVDE GAQVICLPLA GAEFSVQANE 
ADQEAIAYAV NHGVVVVASG GPLGEASYPA AYPGVLAVGS VGPDGSLSEF SSRGDHIAVT 
APGEEITVVD PDGGYTTVSG SDAAAAFVAG VAALIRGEFP QLKPEQVVEA ITSGAQAADP 
AAAGQPGYGA GVVNAPDAFT TAKSTADHVP PFDPELAEQL EEEPLIPYWM LWTGGAVLLI 
VAAVVAMVVA HRRAADPYGF GKRKPEEPEE PEPVPTARRP VRGRRRRGRG RRGVSR