Gene Cfla_0242 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cfla_0242
Symbol
ID	9144108
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cellulomonas flavigena DSM 20109
Kingdom	Bacteria
Replicon accession	NC_014151
Strand	-
Start bp	278887
End bp	280230
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	71%
IMG OID
Product	cellulose-binding family II
Protein accession	YP_003635360
Protein GI	296128110
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGACTCC GACACACGTC CCGGCCACGC AGGGCGGTGC TCGTGGCAGC AGCCGCGGCG 
CTCGTCCTCG GCGGCCTCGC AGCCCCCGCG ACGGCCCAGC CCGCCCCCAC CCTGGCGGGC 
GGCGTCGCGC CCATGGCCGG CTCGGCCGGC TGTGGCAGCT CACCGCGCCT GAGCACCGGC 
AACCAGACCA TCACCAGCGG CGGGCAGCAG CGCTCGTTCC GCCTCGACGT GCCCTCCAAC 
TACGACCCGA ACCGGCAGTA CCGCCTGGTG TTCGGCATCC ACTGGTGGCA CGGTACGTCG 
CAGGACGTCG TCAACGAGCA GTTCTACGGC CTCAAGCCGC TGGCCAACAA CAGCACGATC 
TTCGTCGCGC CGCAAGGCAT CGACAACGCG TGGCCCAACC CCAACGGGCG TGACACCACG 
TTCATCGACG ACATCCTGCG CACGGTCCAG AACGCGCTGT GCGTCGACTC GTCGCAGATC 
TTCTCGACCG GCTTCAGCTA CGGCGGCGGC ATGAGCAACG CGCTGGCGTG CGCGCGTGCG 
AACGTGTTCC GCGCGGTGGC GGTGCTCAAC GGTGCGCAGC TCTCCGGCTG CGACGGCGGC 
ACCCAGCCCA TCGCGTACCT CGGCTCGCAC GGCGTCGTCG ACAGCGTCCT CAACATCTCC 
CAGGGCCGCG CACTGCGTGA CCGCGCACTG CGGAACAACG GCTGCCAGGC CCAGAACGCT 
CCCGAGCCGC AGGGCAACAG CGGGCAGGCG CACACCAAGA CGGTGTACCA GTGCCGCGAC 
GGCTACCCCG TGGTCTGGAT CGCCAACGAC AGCGACCACC AGTGGGCCGC TGTCGACCGC 
GGCCAGCAGC GCTCGCACGT CCCCGGGGAG ATCTGGTCGT TCTTCACGTC GCTGCCGTCG 
ACGAGCGGCC CGACGCCCAC CCCGACGCCC ACCCCGACGC CGACGGTCTC GCCGACGCCG 
ACCTTCTCGC CCACGCCCTC CTCGACGCCG ACGGTCTCGA CCACGCCGAG CCCGACGCCG 
TCGCCCGCGG GCACCACCCC GCCGCCCGCC TCGGGTGGCT GCACCGCGAC GTACAAGCTC 
ATGAACTCGT GGCCCGGCGG CTGGCAGGGT GAGGTGACCG TGAGCGCCGG TTCCTCGATC 
CGCGGCTGGA CCGTCTCGTG GAGCTCGAAC GGCGAGCGCA TCGAGCAGCT CTGGAACGGC 
GAGCTCTCGC AGGGCGGTCA GGTCCAGGTG AAGAACGTGT CCTGGAACGG CGCGCTGAAC 
GCGAGCGGCA GCGCGAGCTT CGGCTTCCTC GGCAGCGGCA ACGCGCCGTC GAGCCTGTCG 
AACCTCACCT GCTCGGCCGC CTGA

Protein sequence

MRLRHTSRPR RAVLVAAAAA LVLGGLAAPA TAQPAPTLAG GVAPMAGSAG CGSSPRLSTG 
NQTITSGGQQ RSFRLDVPSN YDPNRQYRLV FGIHWWHGTS QDVVNEQFYG LKPLANNSTI 
FVAPQGIDNA WPNPNGRDTT FIDDILRTVQ NALCVDSSQI FSTGFSYGGG MSNALACARA 
NVFRAVAVLN GAQLSGCDGG TQPIAYLGSH GVVDSVLNIS QGRALRDRAL RNNGCQAQNA 
PEPQGNSGQA HTKTVYQCRD GYPVVWIAND SDHQWAAVDR GQQRSHVPGE IWSFFTSLPS 
TSGPTPTPTP TPTPTVSPTP TFSPTPSSTP TVSTTPSPTP SPAGTTPPPA SGGCTATYKL 
MNSWPGGWQG EVTVSAGSSI RGWTVSWSSN GERIEQLWNG ELSQGGQVQV KNVSWNGALN 
ASGSASFGFL GSGNAPSSLS NLTCSAA