Gene Acel_1729 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acel_1729
Symbol
ID	4484850
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidothermus cellulolyticus 11B
Kingdom	Bacteria
Replicon accession	NC_008578
Strand	-
Start bp	1949446
End bp	1950636
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	67%
IMG OID	639730519
Product	carboxyl-terminal protease
Protein accession	YP_873487
Protein GI	117928936
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGGATCT CGCGTCGTTC ACGATGGGTT CGTATCGGGG GCGCGGTTCT CGCGCTTGCC 
TCGATCTATA GCGCCGGTGT GGTGACCGGC GTTCTCGGGA GCAGCGGTTC CGCCCCGCAG 
CGACCGGCCG CCGCGCCTAG TTCCCCCGGC TTTCTGGACC AGGTGGAACA GACAATTCTG 
CGCAACGCCG CGAAACCGGT CACGGCGGAC GAGCTCGATC GCTCCGCTAT CCGCGGAATG 
CTCGACGCGC TGGACGACAA ATGGTCCAGC TATTATTCCG CGGCGGATTT TGCCTCGTTC 
GAAAATGTCA TGAATGGTCA ATACACCGGT GTCGGTTTGT GGGTGCACCG TGATGCGTCC 
GGTGCGGTGA CCGTTCTCAA CGTGCAGGCG GGTTCACCGG CGGATCGAGC CGGTGTGCGC 
AGCGGGGACG TCGTTCTTGC CGTCGGCGGC GTCCCGGTTG CCGGGCGGTC GATTGCCGAT 
GTCGTGACCG CGCTCCGTGG CGATGCCGGG ACGACGGTCA CCCTCACCTA CCGGCGTGGT 
GACGTCGTCC GCACGGTGAC GATGCGGCGG AGCGCGGTGG CGAGTGAGGA TGTCACGGCT 
GCCACACAGA ACGGAGTCAT GATCATCAAG GTGAGTGCGT TCAGTCGTGG CGTCGCCAAC 
CGGGTTCGCG CGTTGGATTC GCTGGCGCGG ACCCAACGGG ACCGCGGGAT TGTGCTGGAT 
TTGCGGGGGA ATCCCGGCGG CCTGCTCGAA GAGGGGGTCC AGACGGCATC GGTGTTTCTT 
GACGGCGGCC TGGTGGCCAC GTTCGTACGA CGCGGCGCTC AGCCGGTCGC GCTCAAGGCT 
GCCCCAGGGG GCGACATCGC GACGCCGCTG GCTGTTCTCG TGGATGGGGG GACGGCGAGC 
GCCGCGGAGA TCGTCGCCGG TGCGCTGCAG GACCGGCAAC GGGCGGTGGT GGTCGGCAGC 
CCGACCTTCG GCAAGGGGTC GGTGCAGCAG CCGATTCCGT TGGCCGACGG CTCGGCGATC 
GAGTTCACCG TCGGCACGTA TCTCACGCCG GCGGGACGTT CCCTCGACGG GGTTGGGGTG 
CAGCCGGATG TCCCGGTCGC GGCGAATGCT CCGCCGTCGC TGGCGCTCGA GGAGGCTGTC 
GACGTCATAT CCGGGTTGCT CGCCAACGCG GGTACGAGTG GACACGGTTG A

Protein sequence

MRISRRSRWV RIGGAVLALA SIYSAGVVTG VLGSSGSAPQ RPAAAPSSPG FLDQVEQTIL 
RNAAKPVTAD ELDRSAIRGM LDALDDKWSS YYSAADFASF ENVMNGQYTG VGLWVHRDAS 
GAVTVLNVQA GSPADRAGVR SGDVVLAVGG VPVAGRSIAD VVTALRGDAG TTVTLTYRRG 
DVVRTVTMRR SAVASEDVTA ATQNGVMIIK VSAFSRGVAN RVRALDSLAR TQRDRGIVLD 
LRGNPGGLLE EGVQTASVFL DGGLVATFVR RGAQPVALKA APGGDIATPL AVLVDGGTAS 
AAEIVAGALQ DRQRAVVVGS PTFGKGSVQQ PIPLADGSAI EFTVGTYLTP AGRSLDGVGV 
QPDVPVAANA PPSLALEEAV DVISGLLANA GTSGHG