Gene Cfla_1257 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cfla_1257
Symbol
ID	9145136
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cellulomonas flavigena DSM 20109
Kingdom	Bacteria
Replicon accession	NC_014151
Strand	+
Start bp	1404363
End bp	1405949
Gene Length	1587 bp
Protein Length	528 aa
Translation table	11
GC content	74%
IMG OID
Product	peptidase S1 and S6 chymotrypsin/Hap
Protein accession	YP_003636356
Protein GI	296129106
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAATCAGG TCGACGGACG TAGGTGGAGG GCTGCCCGGG CAGTCATCGC TCTGATGGCG 
CTGACGGCGG TCGCGGCGCC CGCGCACGCG GTGCAGGGCG TCGTGCCCGG GGCGGCCGCA 
GCGGCGGCGA CCGTGCGCCT CGAGATCGCG GGTCACCCCG ACGCGGTGCC CGGGGAGACG 
CGGGAGCGGG CGTGCTCGGG GGCGCTGGTC GCCGCGTCGT GGGTGATCAC GGCAGCGTCG 
TGCTTCGCGG ACGCGTCCGG CGCGGCGGTG ACGGCCGGCG CGCCGCGCTG GGCGACGACG 
GCGACGGTGG GGCGCCCTGA CCTGACGGCG ACGACCGGGC AGGTGCTCAA GGTGGACCGG 
CTCGTGCCGC ACCCCGACCG CGACGTCGTC CTGGCGCACC TGGCGTCGAC GGTGACCACC 
ACGACTCCGT TGGCGGTCGC GACGACGCCG CCGGCGGTCG GCGAGACGCT GACGGTCGCC 
GGGTACGGCC GTACCGCCGA CGCCGTCGTC CCCGACACCG TGCACGCCGC GGCGTACTCG 
GTGGCGTCGG TCGGCGACAG GGCTCTCGAC ATCGTGCCGG CGCAGGACGA TGCCGCAATC 
TGCAAGGGCG ACGCGGGTGG CCCGGCGCTG CGTGCGACGG CGAGTGGGGG AGTGGAGCTC 
GTCGCAATCC ATCACACCGC CTACCAGGGC GGCTGCCTCG GGTCGGTGAG CACCCGCAGG 
GAGGCCACCG AGACGCGCGT CGACGACCTC CGCGACTGGG TCGGGCAGGT CACCGCACCG 
ACGCAGCACC TGGCGCTCGG CGGAGGTCGT GTCGGCGTCG TGACCGACGC ACGCAAGGCG 
ATCGTCGCCG ACGGGCTCAC GGGCAGCTGG ACGACGGTGC ACGACGACGC CGCGCAGGTC 
GTCCTCGACG GCACGCGCAT CGGCGTACTG ACGTCGGACG GCGTCGCTCT CGTGAAGGAC 
GGGGGCATCA CGGCCCCGTT CGTCCGCGTC GCCGGTGGCG TGCAGCAGCT CGTGCTGTCC 
GGCGACCGCA TCGGTGTGCT GACGGACGGC GGGGACGCCT CTGTGAAGGA GGGGCCGGTC 
AACGCCGGGT GGGTCAAGGT GTCAGGGGGC GTGAAGCAGC TCGTGCTGTC CGGCGACCGG 
ATCGGCGTGC TGACCCACGG CGGCGACGCC TCTGTGAAGG AGGGGCCGGT CAACGCCGGA 
TGGGTCAAGG TGTCAGGGGG CGTGAAGCAG CTCGTGCTGT CCGGCAACCG CATCGGCGTG 
CTGTCTGACG GCGGCGAAGC CTCCGTGAAG GAGGGCGGTC TGGGTGCCGG CTGGGTCGCC 
GAGCACGGCG GCGTGCGCGA CCTCGCGCTG TCGGGTGACC GGATCGGTGT GCTGACGAAC 
GGGCGTGACG CCCTGGTGAA GGAGGGCGAC CTGCGAGCGG GATGGGTCGT CGAGTACGGC 
GGTGTGCAGT CGATGGTGCT CTCGGGCAAC CGCATCGGTG TGGTCACCGG TGACGGTGCC 
GCACTCGTCA AGGAGGGCGC GCTGAACGCC GGCTGGACCA GCGTCTGGGG GAAGTGCCAC 
CAGGGGCCGT GCAGCACGTC GGGGTGA

Protein sequence

MNQVDGRRWR AARAVIALMA LTAVAAPAHA VQGVVPGAAA AAATVRLEIA GHPDAVPGET 
RERACSGALV AASWVITAAS CFADASGAAV TAGAPRWATT ATVGRPDLTA TTGQVLKVDR 
LVPHPDRDVV LAHLASTVTT TTPLAVATTP PAVGETLTVA GYGRTADAVV PDTVHAAAYS 
VASVGDRALD IVPAQDDAAI CKGDAGGPAL RATASGGVEL VAIHHTAYQG GCLGSVSTRR 
EATETRVDDL RDWVGQVTAP TQHLALGGGR VGVVTDARKA IVADGLTGSW TTVHDDAAQV 
VLDGTRIGVL TSDGVALVKD GGITAPFVRV AGGVQQLVLS GDRIGVLTDG GDASVKEGPV 
NAGWVKVSGG VKQLVLSGDR IGVLTHGGDA SVKEGPVNAG WVKVSGGVKQ LVLSGNRIGV 
LSDGGEASVK EGGLGAGWVA EHGGVRDLAL SGDRIGVLTN GRDALVKEGD LRAGWVVEYG 
GVQSMVLSGN RIGVVTGDGA ALVKEGALNA GWTSVWGKCH QGPCSTSG