Gene Cfla_3049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cfla_3049
Symbol
ID	9146961
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cellulomonas flavigena DSM 20109
Kingdom	Bacteria
Replicon accession	NC_014151
Strand	-
Start bp	3392862
End bp	3395291
Gene Length	2430 bp
Protein Length	809 aa
Translation table	11
GC content	75%
IMG OID
Product	glycoside hydrolase family 3 domain protein
Protein accession	YP_003638131
Protein GI	296130881
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.340429
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.82066
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGAGA CCCTCGGCAC CGCCGCCCAG CCCGCGGCCC CGTCGGACGC CCTGCCGCCC 
GTCCTGCCCG TCGTCTCCCA GCGGGTCCGT GACCTGCACG CGCGCATGAC GCTCGAGGAG 
AAGCTGGCCC AGCTGGTCGG CTACTGGTTG GACCAGAACG GCACCGTCGC CCCGATGCAG 
TCGGAGATGG CCGCCGGCCA GAAGGGCTCC GACGAGCTCG CGGAGATCAC GCGGCACGGC 
CTGGGCCACT ACACGCGCGT CTACGGCACG CGCCCGGTCG ACCCGGCCGA GCGCGCCGCG 
TGGCTGTGGG CCGAGCAGCG CCGGCTCAAG CGCGAGACGC GCCTGGGCAT CCCGGCGCTG 
GTGCACGAGG AGTGCCTCAC GGGCCTCGCC GCCTGGAAGG CGGCGAGCTA CCCGACGCCG 
CTCGCGTGGG GCGCGTCGTT CGACCCCGAG CTCGTCCACG CCGCCGCGCG CGCGATCGGC 
GACTCGATGC GCGAGCTCGG CATCCACCAG GGCCTCGCGC CCGTCCTCGA CGTCGTCGGC 
GACCCCCGCT GGGGCCGCGT CGACGAGTGC ATCGGGGAGG ACCCGTACCT CGTCGGGACC 
GTCGGCACGG CGTACGTGCG CGGTCTGCAG GAGGCCGGCG TCCACGCGAC GCTCAAGCAC 
TTCGTCGGGT ACTCCGCGTC CGCCGCGGGC CGTAACCACG CGCCCGTGCA CGCGGGCCCG 
CGCGAGCTCG CCGAGATCTA CCTCCCGCCG TTCGAGATGG CCGTGCGCGA CGGCGGCGTC 
CGCTCGGTGA TGAACTCCTA CGCGGACGTC GACGGCGTGC CCGTCGCGGC CGACCCGCAC 
TACCTCACCG AGGTGCTGCG CGAGCAGTGG GGCTTCGACG GCGTCGTCGT CGCCGACTAC 
TTCGCGGTCG CGTTCCTGCA GGTCATGCAC CAGGTCGCGG CCGACCGCGG CGAGGCGGCA 
GCGCTCGCGC TGGCCGCGGG CCTGGACATC GAGCTGCCGA CGGGCGACGC GTTCCTCGCG 
CCGCTGGCCG AGCGCGTGCG CGCCGGGCTG ACCGACGAGG CCCTCGTCGA CCGGGCCGTG 
CTGCGCGCGC TGGCGCAGAA GGAGGAGCTC GGGCTGCTCG ACGCCGACGC GTTCGAGGAC 
GAGCCGCCCG CGCACGTCGA CCTGGACTCC CCGCGGCACC GCGAGCTCGC CCGCAAGCTG 
GCCGAGGAGT CGGTCGTGCT GCTGTCGAAC GACGGCGTGC TGCCGCTGGC TCCGGGGCGG 
CGCGTCGCCG TCGTCGGCCC CAACGCCGCG CGGCCCGAGG CGCTCATGGG CTGCTACTCG 
TTCGCCAACC ACGTGCTGGC GCACCACCCG GGCCTGCCGC TGGGCTTCGA GATCCGCAGC 
GTGCACGAGG CGCTCGCCGC GGCCGTGCCC GGCGTCACGT ACGTCGAGGG CTGCACGGTC 
GAGGGCGACG ACACCGGCGG CTTCGACGCT GCCGTCGCGG CCGCGGCCGA CGCGGACGTC 
GCGGTCGTGG TGGTCGGCGA CCAGGCCGGG CTGTTCGGCC GCGGCACGGT GGGCGAGGGC 
AACGACGTGC AGTCGCTCGA GCTGCCGGGC GTGCAGCGGC AGCTCGTCGA GGCGCTGGTG 
GCCACGGGGA CGCCCGTCGT CATGCTGCTG CTCACCGGCC GCCCGTACGC GATCGGCTGG 
GCACTCGACG GGCAGGGCGC CAAGCCCGCC GCCGTGCTGC AGGCGTTCTT CCCCGGCGAG 
GGCGGCGGCG ACGCGATCGC CGACCTGCTC ACGGGCGTCG CCAACCCGTC CGGGCGTCTG 
CCCGTCTCGC TGCCGCGCGC CGCGGGCGCG CAGCCGTTCC GCTACCTGCA CCCCGTGCTC 
GGGGGCCCGT CCGACGTCAC GTCGACCGAC CCGACGCCCG TGCGGCCCTT CGGGTTCGGG 
CTGTCGTACA CGACCTTCGC GTACGACGAC CTCGCGGTCG ACGAGACGGT CGAGTCGGCC 
GGCACGTTCA CGACGTCCGT CACGGTGACG AACACCGGTG ACGTCGACGG CGCCGAGGTC 
GTGCAGCTCT ACGGGCGGGA CGTCGTCGCG TCCGTCGTGC GCCCCGTCGT GCAGCTCCTC 
GGGTACGCGC GCGTCGAGCT CGCCGCGGGG CAGTCCCGCC GCGTGACGTT CCGCGTCCCC 
ACCACGCGCC TCGCGCTGGC CGACCGCCGC CTCGTGCGCG TCGTCGAGCC CGGCGACGTG 
CAGGTCTGGG TCGCCTCGCA CGCGGCCGTC GCCGCGCCGG ACGCCCCCAC GGACGCCACG 
GGCGGCGCCA TCACCAGCAC GCGCGAGCAC GAGAAGCGCA CACTGCCGGG GCAGAGCACA 
CCGCACGCCG TCCTGCGGGT CACGGGCGCC GTGCACGAGA TCACCGCCGA GGACCGGCGG 
ATCGTCGACG TGGAGGTCAA CGACGCATGA

Protein sequence

MTETLGTAAQ PAAPSDALPP VLPVVSQRVR DLHARMTLEE KLAQLVGYWL DQNGTVAPMQ 
SEMAAGQKGS DELAEITRHG LGHYTRVYGT RPVDPAERAA WLWAEQRRLK RETRLGIPAL 
VHEECLTGLA AWKAASYPTP LAWGASFDPE LVHAAARAIG DSMRELGIHQ GLAPVLDVVG 
DPRWGRVDEC IGEDPYLVGT VGTAYVRGLQ EAGVHATLKH FVGYSASAAG RNHAPVHAGP 
RELAEIYLPP FEMAVRDGGV RSVMNSYADV DGVPVAADPH YLTEVLREQW GFDGVVVADY 
FAVAFLQVMH QVAADRGEAA ALALAAGLDI ELPTGDAFLA PLAERVRAGL TDEALVDRAV 
LRALAQKEEL GLLDADAFED EPPAHVDLDS PRHRELARKL AEESVVLLSN DGVLPLAPGR 
RVAVVGPNAA RPEALMGCYS FANHVLAHHP GLPLGFEIRS VHEALAAAVP GVTYVEGCTV 
EGDDTGGFDA AVAAAADADV AVVVVGDQAG LFGRGTVGEG NDVQSLELPG VQRQLVEALV 
ATGTPVVMLL LTGRPYAIGW ALDGQGAKPA AVLQAFFPGE GGGDAIADLL TGVANPSGRL 
PVSLPRAAGA QPFRYLHPVL GGPSDVTSTD PTPVRPFGFG LSYTTFAYDD LAVDETVESA 
GTFTTSVTVT NTGDVDGAEV VQLYGRDVVA SVVRPVVQLL GYARVELAAG QSRRVTFRVP 
TTRLALADRR LVRVVEPGDV QVWVASHAAV AAPDAPTDAT GGAITSTREH EKRTLPGQST 
PHAVLRVTGA VHEITAEDRR IVDVEVNDA