Gene Cfla_1008 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cfla_1008
Symbol
ID	9144883
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cellulomonas flavigena DSM 20109
Kingdom	Bacteria
Replicon accession	NC_014151
Strand	+
Start bp	1117325
End bp	1118788
Gene Length	1464 bp
Protein Length	487 aa
Translation table	11
GC content	77%
IMG OID
Product	peptidase S1 and S6 chymotrypsin/Hap
Protein accession	YP_003636113
Protein GI	296128863
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGACG AGGGCCAGGT GCCCGCGGGC GGCGTCGCGC AACCGGAGCG GGCCACCGAG 
CACCCGGAGC CGCCGGTCCC GGCGCCGCAG GTACCCGCGC CGCCGCCGGT CGCGCCCTTC 
GCCGCGCCCT CGTCCTACCG GCGCGCGTCG GGTGGCACGA CCGCGGCACC GTCGCCCGCC 
ACGCCGCCCG GGTCGTCCCT GCCGCCGCCG CTCGCGCCGT CGGGTGCGCC CGGCGGTCCC 
TGGGCGCCCG CCCCGTCCAG CGCGCTCCCG CCCCAACTCG GCGCCGGGGC CGCCCGGTCG 
CACGGGGTCT CAGGAGGTGC GGCGCAGGGC CTGCCGGCGT TCGCGCCCGC CCCTGCCGCG 
GCTCCGCGGC GGCGGCGCCG CACGCCGTCG GTCGCATGGG TCGTGCCACT GGTCCTGCTG 
TCGCTCGCGG CGGGCTACCT GGGTGGTCTG CTCGGCGCGC GCCACCAGAC CGGCGACGCC 
CGCCTCGTCG ACGCGGGCCT GCCCGTCGTG CCGGCGCCCG CGGCGCAGCC GGACCGCGCC 
CCGGAGTCGA TCGCGGGCAT CGCCGCCGGC GTCCTGCCGA GCGTGGTGTC GCTCGCGGTG 
ACGACGGCCG ACGGCGGCGC CACCGGGTCG GGCTTCGTGC TCCGGCAGGA CGGGTACGTG 
CTGACCAACA ACCACGTCGT CCAGGGTGCC GAGGGCGGCA CCCTCGTCGT GCAGCTCTCC 
GACGGCAGCG AGCTGCCCGG CACCGTCGTG GGTGCGACCG CCGACTACGA CCTCGCGGTC 
GTGAAGGTCG ACGCCACCGG GCTGACGCCG CTCGCGCTCG GCGACTCGGA CGCCGTCGTC 
GTCGGTGACC CGGTGGTCGC GATCGGCGCG CCCCTGGGCC TGGTCGGCAC GGTGACGACG 
GGTATCGTCA GCGCGCTCAA CCGCCCCGTC GTCGCCGGTG CCTCCGAGAC GGAGCAGGCC 
TTCATCAACG CCATCCAGAC CGACGCGGCG ATCAACCCGG GGAACTCCGG CGGCCCGCTC 
GTCAACGCGC GCGGCGAGGT CGTGGGCATC AACTCGGCGA TCGCGCAGCT GCCCGGGCGC 
GTGACGGACA TGGGGAGCAT CGGCCTCGGC TTCGCGATCC CGTCGAACCA GGCGCGGCGC 
ACCGCCGAGC AGCTCATCGA GACCGGCCGG GCCACCTACC CCGTCATCGG CGTGACCCTC 
GACCCGGCGT ACTCCGGCGA GGGTGTGCAG GTCTTCGCGC AGGACCCGCG CGACGGTGTC 
GCCGTCCGCG AGGACGGCCC GGCCGACCGT GCGGGCATCC GCCGGGGCGA CGTGATCCTC 
GCGATCGACG GCCGCCCGGT GACGGAGTCG GAGGAGCTCA TCGTCGCGAT CCGCGCCCGT 
CAGGTCGGCG ACACGGTGGT GCTGCGCGTG CGGACCGGGG AGGAGGAGCG TGAGGTGCGC 
GTGCGCCTGG AGGCGTCGGA GTGA

Protein sequence

MSDEGQVPAG GVAQPERATE HPEPPVPAPQ VPAPPPVAPF AAPSSYRRAS GGTTAAPSPA 
TPPGSSLPPP LAPSGAPGGP WAPAPSSALP PQLGAGAARS HGVSGGAAQG LPAFAPAPAA 
APRRRRRTPS VAWVVPLVLL SLAAGYLGGL LGARHQTGDA RLVDAGLPVV PAPAAQPDRA 
PESIAGIAAG VLPSVVSLAV TTADGGATGS GFVLRQDGYV LTNNHVVQGA EGGTLVVQLS 
DGSELPGTVV GATADYDLAV VKVDATGLTP LALGDSDAVV VGDPVVAIGA PLGLVGTVTT 
GIVSALNRPV VAGASETEQA FINAIQTDAA INPGNSGGPL VNARGEVVGI NSAIAQLPGR 
VTDMGSIGLG FAIPSNQARR TAEQLIETGR ATYPVIGVTL DPAYSGEGVQ VFAQDPRDGV 
AVREDGPADR AGIRRGDVIL AIDGRPVTES EELIVAIRAR QVGDTVVLRV RTGEEEREVR 
VRLEASE