Gene Cfla_1572 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cfla_1572
Symbol
ID	9145458
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cellulomonas flavigena DSM 20109
Kingdom	Bacteria
Replicon accession	NC_014151
Strand	-
Start bp	1746177
End bp	1748285
Gene Length	2109 bp
Protein Length	702 aa
Translation table	11
GC content	74%
IMG OID
Product	cellulose-binding family II
Protein accession	YP_003636669
Protein GI	296129419
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0280577
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.00883315
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCCCGGAC GGTCCGACCG CGCACGCACG GCCGGAGCTC TGGCCGCCGC ACTCGCCCTC 
GCCACGCTCG CCCCCACGTC CGCCATGGCG GCTCCCCCGG GCACCGCGGG CGCCGTCGGG 
GAGGAGGTCG GGGTCGCGTT CTCGACGACG GGCCGGGTCT TCAGCGGGTC GCTGCAGATC 
GGCCTGTCGA CGTCCGTGCC GGGTGCCGAG GTCCGGTACA CCACGGACGG CACCACGCCG 
ACCCTCTCGT CGCCGGTCGC CTCGGGGCCG CTGACCCTCA CGCGCAGCAC CGAGGTCCGC 
GCGCAGGCGT TCGTGGCCGG GGCTCCCACC GGCGAGCCCA CGTCGCAGCG GTACGTCGCG 
AGCAACGTCA CGACGCGTCA CGACCTGCCC GTGCTCGTGC TCGACTCGCT CGGCAAGGGC 
GTCGTCGGCG ACGACGCCCA CGCGGCGGCG GTCGTCGAGC TGCAGCCGCG GGGGGGCACG 
ACGAGCCTGA CCGACGAGCC CGCGCTCGTC ACGCGTGCCG GGTACCGCCT GCGCGGGCAG 
TCGAGCCGCA TGTTCGACAA GAAGCCGTAC CGCCTCGAGC TGTGGGACGA CGAGGGCGAC 
GACCTCGACC AGCCGTTCTT CGGCATGCCC GCGGAGTCCG ACTGGGTGCT GCGCGGGCCG 
TTCTCCGACA AGTCGCTCGT GCGCGAGGCG CTCACCCTGG ACCTGGGCCG CGAGCTCGGC 
CTGCACGCAC CGCGCCACCG CCTCGTCGAG GTCTACGTGA ACGACGACGC GCAACCGGTC 
GCGGCGAACG ACTACCGCGG CGTCTACCTG CTCGAGGAGA CGATCAAGAA CCAGAAGGAC 
CGTCTCGACC TCAAGAAGCT CGACCCCGAG GACGTGACGT CGCCGCGCAT CGAGGGTGGC 
TACATCATCA AGGCCGAGTG GCTCGCTGCC GAGCAGCCGC TCATCCCCTG CAGGGGCACG 
TCGCGCTGCT GGAGCGACCT CGAGGTGCAC GACCCGGACG ACCTGGTGCC CGCACAGCTC 
GACTGGATCG CCGGGTACGT CGGCCGCGTG AACGACGCCC TGCACTCGTC GAACCCCGCG 
GACCCGCAGA CCGGCTACCC CGCGCTGATC GACGTCGAGT CGTTCGTCGA CCAGGTGATC 
GTCAACGAGC TCAGCCGTGA CATGGACGCC TACTTCCGCA GCCAGTACTT CTACAAGGAC 
CGCGGCGGGC TGCTCACCGC GGGGCCGCTG TGGGACTTCG ACCTCACGTA CGGCGTGGGC 
GGCTTCTTCG GCAACGACCA GGTCTCGGGG TGGCAGTACC AGCAGTCGCG CCAGAGCCCC 
GCGCCGCTCG ACTGGTTCTC GGTCCTGATG TCGGACCCCG CCTTCGTCAA CCACGTCAAG 
GTGCGCTGGC AGGAGGCGCG CCGCGGACCG CTGTCCGACG CGGCCCTCCG CTCGCGGATC 
GACGACCTCA CCGCGCCCCT CGGCGGCGCC GCCGCGCGCA ACTTCCAGCG CTGGCCGAAC 
CTCACGACCC GGCAGATCGG CCCGTTCGTC ACGCCGACCG CCGGCACCTG GGAGGGGCAG 
GTCGCACACC TCGAGGACTG GCTGCTGCGC CGCGCCGCGT GGCTCGACTC GACCGCCGCG 
TGGGGCGGGC CGACGGACCC GCTGCCGACG CCGAGCGCGA CGCCGGCGCC CAGCGCCACA 
CCCACGCCGA CGCCGACCCC GACGCCCAGC ACCACGCCCA CGCCCACGCC CACGCCCACG 
GTGAGCCCGA CCCCGAGCCC CACGCCGACG CGCAGCGTCA CACCGTCGCC GACGCCCGTC 
CAGGGCGGTC AGGGCTGCAC CGCGACACTG CGCACCGTGT CGTCCTGGCC CGGCGGGATC 
CAGGGCGAGG TCACGGTGAC CGCGGGCGCC GCGGCGCTGC GCGGGTGGGC CGTGACGCTG 
ACGCTGCCCG CGGGCGTCTC CGTCGCGCAG GTGTGGAACG CCGGCCTCAC GGGTTCGTCG 
TCGACCGTCA CGGCACGCAA CGTCGACTGG AACGGGACGC TCGGGGCGGG CGCCTCGACG 
ACGTTCGGGT TCCTCGGCTC CGTGACCGGG TCGCTCGAGG GCGTCACGCT CGCCTGCACC 
GCGGCCTGA

Protein sequence

MPGRSDRART AGALAAALAL ATLAPTSAMA APPGTAGAVG EEVGVAFSTT GRVFSGSLQI 
GLSTSVPGAE VRYTTDGTTP TLSSPVASGP LTLTRSTEVR AQAFVAGAPT GEPTSQRYVA 
SNVTTRHDLP VLVLDSLGKG VVGDDAHAAA VVELQPRGGT TSLTDEPALV TRAGYRLRGQ 
SSRMFDKKPY RLELWDDEGD DLDQPFFGMP AESDWVLRGP FSDKSLVREA LTLDLGRELG 
LHAPRHRLVE VYVNDDAQPV AANDYRGVYL LEETIKNQKD RLDLKKLDPE DVTSPRIEGG 
YIIKAEWLAA EQPLIPCRGT SRCWSDLEVH DPDDLVPAQL DWIAGYVGRV NDALHSSNPA 
DPQTGYPALI DVESFVDQVI VNELSRDMDA YFRSQYFYKD RGGLLTAGPL WDFDLTYGVG 
GFFGNDQVSG WQYQQSRQSP APLDWFSVLM SDPAFVNHVK VRWQEARRGP LSDAALRSRI 
DDLTAPLGGA AARNFQRWPN LTTRQIGPFV TPTAGTWEGQ VAHLEDWLLR RAAWLDSTAA 
WGGPTDPLPT PSATPAPSAT PTPTPTPTPS TTPTPTPTPT VSPTPSPTPT RSVTPSPTPV 
QGGQGCTATL RTVSSWPGGI QGEVTVTAGA AALRGWAVTL TLPAGVSVAQ VWNAGLTGSS 
STVTARNVDW NGTLGAGAST TFGFLGSVTG SLEGVTLACT AA