Gene Cfla_0804 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cfla_0804
Symbol
ID	9144676
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cellulomonas flavigena DSM 20109
Kingdom	Bacteria
Replicon accession	NC_014151
Strand	-
Start bp	869462
End bp	871351
Gene Length	1890 bp
Protein Length	629 aa
Translation table	11
GC content	64%
IMG OID
Product	protein of unknown function DUF87
Protein accession	YP_003635913
Protein GI	296128663
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCTCGCT CAACGGATCG CCCAAGCGAG CGACCCGCCT GGATCCGGCG CGTCCGGGTC 
TTCCAGGCGC TGGCTGCAAC CGCAATCCTG CTCGTCGCTG CCTCGAACGT GTCCTCCGAA 
CCACTGGCCC AGTGGTGGTT CTGGGTCGCT GCGACTACCG CGCTCACACT CGCCCTTGTC 
GAGCCGTACT ACACCGGTGT GCAAGCGGCG ATGCTCTTTG GTGCCGCAGG CCTCGCGGCC 
GGCCTCACTG CTGATCGGGC GGGCGTCGAG CCGCTCTGGA TCGGCCACGT CGTCCTTGCC 
GGTGCCGTCT TCGTCGCCGC CCTTACCGCC CTCGCAAGTC AGCCAGGGAG ACTACGCGAC 
GGATCACGGT GGGTCGCGAC CCGTTTCGGA CGACCTCTCT GGCTTGGTCT ATCAGCCGTG 
ACGATCGAAG CATTACGACA GGCAGCGTCT GGCGCACCGA CGATCGCGAT GACACTGGCT 
GGCGGCACGC TCGCCGCGGT TCTGGTAGCC GCCCCAGACT GGTATCGGCT CGTGGGCGTG 
GCGCAGCCAG CGCCGGATGG CATCGCAATT TTTGAAACCG CGGTGGAGCC AAATCTGATG 
CTACTCGCGA CCGACAGGCG TTACACCCCT GGCGCCTACG TTGAAGTTCA TGGCGTTACG 
GCTTCACGAG GGGTCGTAGT CGGAAATTTG GCGCACAAGG GCGGGAACCG GATCCAGGTC 
GCCTTGGAAG AACCATGGCA CGAGGTCGCC GATTCCAGTG GTCAGCAATG TGAGGTAGTG 
ACGCTCTCCC ACCCTCCTGC TCGGGCGGTC GCGTTTGTCT CAGAGGGCTC TACGGACCGG 
GTACTCAGCC TCCGCCCGTT CGGCGGCCTT GTTCGGGGGG ACACCGTCTA CTGGGAGGAG 
GCGACCTCCG GCGCGCGATA CCTCTACCAG GTAGTGGCAC GCGAGCTGGC AAGGGAAATG 
TGGGACGCCT CATCCGTGGT TACCGAGAGA GCGACCGCGG TGCTGCTGGG TGCTGCGGGT 
CCAGGTGGTC TAACCCCCGG CACCGCGCTT CCTGCGCCGT ATGTTCCGGT GCTCTCGGCG 
GATGAGGTGA CCGGACCGCT GGCTCCGGGA TTTGAGCGAA TCGGCACCAT CGCTGGAACG 
GCACTGCCCT TTGGAGTCTC CGTCGCACAG CTGCGCGGCC ACCACCTTGC GATCCTCGGC 
ATGTCAGGCA TGGGTAAGAG CACGGTTGCC CGGCGACTCA TTGACCTCAT GTCGTCAGCA 
TCGGTCGTCG TTTCTCTTGA CGGGACAGGT GAGTACCGGG CGCGCTTTGG ACTGCCCGCC 
TGGAACGACG CGGTGGGACT CACCACTCCT GGGGCATGGG TATACGAACC CGCGGGCGTT 
CCCGCGCTGC GCGTATCTGA GTTCATCAAG ATGGCGATGA CGCAAGCGGC AGCGGAATAC 
GCGGTAGGGG ACCCACTACG GCGCACTGTC CTCCTCGAGG AGGCTCACTC TTACCTGCCG 
GAGTGGAACT TCGTTGCCGA CCGCAACGAA TCGAGCTACG TAGCCCAAAG CTGCCGCTAC 
ATTCTCCAGG CAAGAAAGTT CGGCTTGAGC TTCATTCTCG TGTCGCAGCG CACCGCAGTG 
ATCAGTAAGT CGGCACTCTC CCAGTGCGAG AGCTATATAG CGCTGCGAAC GCTCGACGCG 
ACAAGCCTTG AGTATCTGGA AGGCGTGCTC GGCAGCCAGT TTCGCGAGAC CGTCTCGGGC 
CTCCAGAGGT ACCAGGCCGT GTGTGCCGGC CCAGCGTTCA GTACATCAAC ACCGGTTGTA 
GTGAACCTCG ATCCCTATCC AGCACCGCCC CCGGCCGGTC CACCAACGTC AACCGGCGCT 
CCCACCACTG CATCTCACAC AGGGGTCTGA

Protein sequence

MPRSTDRPSE RPAWIRRVRV FQALAATAIL LVAASNVSSE PLAQWWFWVA ATTALTLALV 
EPYYTGVQAA MLFGAAGLAA GLTADRAGVE PLWIGHVVLA GAVFVAALTA LASQPGRLRD 
GSRWVATRFG RPLWLGLSAV TIEALRQAAS GAPTIAMTLA GGTLAAVLVA APDWYRLVGV 
AQPAPDGIAI FETAVEPNLM LLATDRRYTP GAYVEVHGVT ASRGVVVGNL AHKGGNRIQV 
ALEEPWHEVA DSSGQQCEVV TLSHPPARAV AFVSEGSTDR VLSLRPFGGL VRGDTVYWEE 
ATSGARYLYQ VVARELAREM WDASSVVTER ATAVLLGAAG PGGLTPGTAL PAPYVPVLSA 
DEVTGPLAPG FERIGTIAGT ALPFGVSVAQ LRGHHLAILG MSGMGKSTVA RRLIDLMSSA 
SVVVSLDGTG EYRARFGLPA WNDAVGLTTP GAWVYEPAGV PALRVSEFIK MAMTQAAAEY 
AVGDPLRRTV LLEEAHSYLP EWNFVADRNE SSYVAQSCRY ILQARKFGLS FILVSQRTAV 
ISKSALSQCE SYIALRTLDA TSLEYLEGVL GSQFRETVSG LQRYQAVCAG PAFSTSTPVV 
VNLDPYPAPP PAGPPTSTGA PTTASHTGV