Gene Cfla_0618 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cfla_0618
Symbol
ID	9144488
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cellulomonas flavigena DSM 20109
Kingdom	Bacteria
Replicon accession	NC_014151
Strand	-
Start bp	665315
End bp	667051
Gene Length	1737 bp
Protein Length	578 aa
Translation table	11
GC content	58%
IMG OID
Product	hypothetical protein
Protein accession	YP_003635729
Protein GI	296128479
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.508373
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.13002
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGAGCGC GCGCAGTCGT CCGGAGGCTA ACGATCAATG ACGGCACTAC GGTTGACGTA 
CCTGAGTCAG GCGTTGTCCT GATTGTCGGA CCAAACAACA CAGGCAAGAG CCAGGCACTC 
AGGGACGTCA TCAAACTCAT GACGTCGTCC GGCGAACCAG GGATCGTGAT TCGAGAGGCC 
GAGATAGAGC ACTTTGGTTC CGAAGACGAT CTCATTGAAA CGTTTGCGTC CGACCGAGCT 
ATTCTTAGGA CGGCGACGGG AGCCGATCAA GCGCACCTAG GAGTTCACGG AGTCCAAGCG 
ATTTCCTCTA TCCGCCAGTG GTGGTCGTCC CCGCACGCCC GTCACCTGGT CGGCGGCTAT 
TTCGCGATTC ATGCCGACAC GGAGAGCCGC CTAGAAGCGA GCAAACCGGC GCCTTCGATG 
GATCTATATG AAAATTCGCC CTCGCATCCA CTTCATCACG TGTATGCAAA TCCTGAGCTA 
GAGACGCGCC TAAACGACAT TAGCCGTCGA GCGTTCAATT CAGGGTTAAT TCTGGATGCG 
TGGTCCGGCG GCAATCAATG GGCGTTTCGC GTGGGAAATA TCGACCCTCC AGACTCGCCC 
CGGCCATCGG TCGCTTACCT CGACGAACTC CGAAAGGCTC CCTTGCTCCA TCAAGTTGGA 
GATGGAGTCC GGAGCATGCT CGGGTTGCTG CTCCGCTTTT ACACCGGCCA CCAGAATATT 
TCGTTGATTG ACGAGCCCGA GGCCTTCTTG CACCCACCTC AGGCAAGGTA TATCGCGCGG 
CTTCTCGCCG ATGAGGCCGC AACCACCGAG AGATCCATCC TCGTCGGCAC GCACAGTACG 
GAAATCGTGC ATGGGGTGCT GGAGAGCTCT GCGTCAGCGA CGCTTGTCAG ACTCTCGCGG 
AATCGAACCA TCAACAACGC GGCCGTTCTC GACAACGATG CAGTTCGAAA ACTCTGGTCA 
GACCCATTGC TGCGATACTC CAACCTGTTG GATGGCCTTT TCACCGACGC AGTAATAGTC 
TGCGAAGCAG ATGCAGATTG CAAGTATTTC GCGGCCGTCA GGGACACTTT TGAAGACGAA 
GCGGTGGAGT CACGACGGCC CGACATCCTA TTCACCAGTT GCGGGGGTAA GCACAAAATG 
CATGCTGCCG TGGAGGCGCT TGTTGCCGCG AGCGTCCCCG TAGCGGTAAT TTGCGACTTT 
GACACCCTCA ACGAGTGGGC GACGCTACGT CGACTATTTG TGTCGGCGGG CGGCGATCCA 
GGTCTTATCG AGACCGACTG GAAGATTCTG AATGCTGCAT TGACTTCAGG TGACCGAAAC 
CCAAGCAAGA TGGGTGTCAA GGAGTCCTTA GATCGATCTT TCGATGCAAT CGAAGAACCC 
GAACTCACGC GAAAGAACAT CGAGTCCCTA CGCCGCGTTC TTCGAATTGA GAACGGCTGG 
GATCGCGTGA AGAACTCCGG AAAATCCGCG GTGCCAGCGG GCGACCCTTA CCGCGCATGC 
GAGCGCATTA TCGCAGCACT CGCTGACCGG CGTATACACC TTGTGCCCGT CGGCGAAATG 
GAAGACCTCG TTCCGGCGGT CGGTGGCCAC GGCGCGGCGT GGGTAGCAGA GGTTCTCGAG 
CAAGGGTTGC ACAACTCGCC CGACAGCGAC GGCGCCCGAG TGCTAATGCG CGCAGTCCTC 
GACTCGCTCG ATCGTGGCGA CGCCGACGCC GTTGTCGAAG AGGGGGCCGA TGCTTGA

Protein sequence

MRARAVVRRL TINDGTTVDV PESGVVLIVG PNNTGKSQAL RDVIKLMTSS GEPGIVIREA 
EIEHFGSEDD LIETFASDRA ILRTATGADQ AHLGVHGVQA ISSIRQWWSS PHARHLVGGY 
FAIHADTESR LEASKPAPSM DLYENSPSHP LHHVYANPEL ETRLNDISRR AFNSGLILDA 
WSGGNQWAFR VGNIDPPDSP RPSVAYLDEL RKAPLLHQVG DGVRSMLGLL LRFYTGHQNI 
SLIDEPEAFL HPPQARYIAR LLADEAATTE RSILVGTHST EIVHGVLESS ASATLVRLSR 
NRTINNAAVL DNDAVRKLWS DPLLRYSNLL DGLFTDAVIV CEADADCKYF AAVRDTFEDE 
AVESRRPDIL FTSCGGKHKM HAAVEALVAA SVPVAVICDF DTLNEWATLR RLFVSAGGDP 
GLIETDWKIL NAALTSGDRN PSKMGVKESL DRSFDAIEEP ELTRKNIESL RRVLRIENGW 
DRVKNSGKSA VPAGDPYRAC ERIIAALADR RIHLVPVGEM EDLVPAVGGH GAAWVAEVLE 
QGLHNSPDSD GARVLMRAVL DSLDRGDADA VVEEGADA