Gene Cfla_2089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cfla_2089
Symbol
ID	9145985
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cellulomonas flavigena DSM 20109
Kingdom	Bacteria
Replicon accession	NC_014151
Strand	-
Start bp	2331921
End bp	2333315
Gene Length	1395 bp
Protein Length	464 aa
Translation table	11
GC content	76%
IMG OID
Product	peptidase M20
Protein accession	YP_003637183
Protein GI	296129933
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0501821
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCACCA CCGACCCCGT CCCGGCCCCT GCCCCCGAGC GCGTCGCCGC ACTGCGCGCG 
CGCGTCGCCG CGCAGTTCCC CGACGTCCGT GCCGACCTCG AGGCCCTGGT GCGCATCCCG 
AGCGTGTCGA ACGCCGAGTT CGACCAGGCG CACGTCGAGG CGTCGGCCGC GGCGGTGGCG 
CGGCTGCTCA CGGAGGCCGG CATGCCGCAG GTCGACGTGC TGCGTGCCAC GGGGCGCGAC 
GGCACCCCGG GCGCGCCCGC CGTGGTCGCC CGTCGCCCTG CCCCCGCCGG CGCACCGACC 
GTCCTGCTGT ACGCGCACCA CGACGTGCAG CCGCCCGGCG ACCGCGCGCA CTGGTCGTCG 
GACCCGTTCG AGCCGACCCC GCGTGGTGAG CGGCTCTACG GCCGCGGGGC TGCGGACGAC 
AAGGCCGGCG TGGTCGCGCA CGTCGGCGCG CTGCGGGCGC TCGGCGACGA GCTGGGCGTC 
GGCGTCACCG TCTTCGTCGA GGGCGAGGAG GAGATCGGCT CGCCCACGTT CGTCGAGTTC 
CTCCAGGCGC ACCGCGCCGC GCTCGCGGCC GACGTCATCG TCGTGGCCGA CTCGTCGAAC 
TGGAAGGTCG GTGTGCCGGG CCTGACCACG TCGCTGCGCG GGCTGGTCGA CCTGGTCGTG 
GACGTCGAGG TGCTGGACCA CGCGGTCCAC TCGGGCATGT TCGGCGGCCC GCTGCTCGAC 
GCCCCCACGC TGCTGGCACG GCTGATCACC ACGCTGCACG ACGAGAACGG CGACGTCGCC 
GTTCCCGGCC TCGTGCACGC ACCCGACCCG GCCGTCGACT ACGAGGAGGC CGACCTGCGC 
GCCGACGCGG GGGTGCTGGA CGGCGTGCGC CTGGCCGGCA CCGGATCCCT GACGGCGCGG 
CTGTGGACCC GTCCGGCGAT CGGCGTCATC GGTCTCGACG CCCCGCGCGT CGCGAGCGCG 
TCGAACACGC TGACGCCCCG CGCGTCCGCG AAGCTCTCGG TGCGCCTGGC GCCCGGCCAG 
GACCCGGCAG CAGCCATGGC GGCGCTGCGC GAGCACCTGC TGGCGCACGC GCCCTTCGGG 
GCCCGCGTCA CCGTGCACGA GGGCGAGCAG GGTCGGCCCT TCCAGGCGCC GGCGGACTCC 
CCGGGCATGC AGGCCGCCCG CTGGGCCATG CGCACGTCGT GGGGCACGCC GCCCGTCGAC 
ATCGGCGTCG GCGGCTCGAT CCCGTTCATC AGCGACCTGC TGGACGTCTA CCCCGACGCC 
ACGATCCTCG TGACGGGCGT CGAGGACCCC GACTCGCGCG CGCACGGCGC GGACGAGTCG 
GTGCACCTCG GCGAGCTCGA GCGCGTCGTG CTCGCCGAGG CGCTGCTGCT GGAGGTGCTC 
GCTCCGTCCG CCTGA

Protein sequence

MTTTDPVPAP APERVAALRA RVAAQFPDVR ADLEALVRIP SVSNAEFDQA HVEASAAAVA 
RLLTEAGMPQ VDVLRATGRD GTPGAPAVVA RRPAPAGAPT VLLYAHHDVQ PPGDRAHWSS 
DPFEPTPRGE RLYGRGAADD KAGVVAHVGA LRALGDELGV GVTVFVEGEE EIGSPTFVEF 
LQAHRAALAA DVIVVADSSN WKVGVPGLTT SLRGLVDLVV DVEVLDHAVH SGMFGGPLLD 
APTLLARLIT TLHDENGDVA VPGLVHAPDP AVDYEEADLR ADAGVLDGVR LAGTGSLTAR 
LWTRPAIGVI GLDAPRVASA SNTLTPRASA KLSVRLAPGQ DPAAAMAALR EHLLAHAPFG 
ARVTVHEGEQ GRPFQAPADS PGMQAARWAM RTSWGTPPVD IGVGGSIPFI SDLLDVYPDA 
TILVTGVEDP DSRAHGADES VHLGELERVV LAEALLLEVL APSA