Gene Cfla_2057 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cfla_2057
Symbol
ID	9145953
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cellulomonas flavigena DSM 20109
Kingdom	Bacteria
Replicon accession	NC_014151
Strand	-
Start bp	2297190
End bp	2298677
Gene Length	1488 bp
Protein Length	495 aa
Translation table	11
GC content	70%
IMG OID
Product	RNA polymerase, sigma 70 subunit, RpoD subfamily
Protein accession	YP_003637151
Protein GI	296129901
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.130961
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.746729
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTGGAC GGACCCACGG CAGCGTCGAC ACCGCCTCGG TGCGCGCCGC TTGCGAGGCT 
GCCGGCGTCG AGGGCCCCAA GCGGCTGCGC GCCGTCGTCC GCGGTCTGGG GACGGCCGGT 
GTCGACGTGA ACGACCTGGG CACCGCCGGC CGGGCCGTCG CCGCGACGAG CGCGAAGTCG 
CGCCCCGCGG CCAAGGCGAC CGTCGCGGAC GCCGGCACGC CCGCGGTGAG GTCGACCCGC 
ACCACGAAGG CGGCGGCGAC CAAGGCCACG GCGACGAAGA CCGCCACCGC CAAGAAGGCC 
GCATCGAAGG CGTCGCCCGC GACGGAGTCC GACGTCGCCG ACGAGCCGGT CGACGAGGTC 
GAGGAGGACG TCGACGTCAC GGAGCTCGAG GACGTCGAGG TCACGGACGC CGACGTCGAG 
ACCGACGACG TGGAGGACGT GGCCGAGGAC GACGCCGAGG AGACCGAGAC CAAGCCCGCC 
GCCGCGAAGA AGGAGGACGA GCCCGAGGAC ACCGGGTTCG TCTACTCCGA CGCGGACGAC 
GACGACGCCC CTGCCCAGCA GGTCGTCACC GCCGGTGCCA CCGCGGACCC GGTGAAGGAC 
TACCTCAAGC AGATCGGCAA GGTCGCGCTG CTGAACGCCG AGCAGGAGGT CGAGCTCGCC 
AAGCGCATCG AGGCCGGCCT GTTCGCCGAG GAGAAGCTCG CCGAGACACG CGACTCCCTC 
GAGCCCAAGC TCCGCCGCGA GCTCGAGTGG ATCGCGCAGG ACGGTCGCCG CGCCAAGAAC 
CACCTGCTCG AGGCGAACCT GCGACTCGTC GTCTCGCTGG CCAAGCGCTA CACGGGTCGC 
GGCATGCTCT TCCTCGACCT GATCCAGGAG GGCAACCTCG GTCTGATCCG CGCGGTCGAG 
AAGTTCGACT ACACCAAGGG CTACAAGTTC TCGACGTACG CCACGTGGTG GATCCGGCAG 
GCGATCACGC GTGCGATGGC CGACCAGGCG CGCACCATCC GCATCCCGGT GCACATGGTC 
GAGGTCATCA ACAAGCTCGC ACGCGTGCAG CGCCAGATGC TCCAGGACCT GGGCCGTGAG 
CCCACCCCGG AGGAGCTCGC CAAGGAGCTC GACATGACGC CCGAGAAGGT CGTCGAGGTC 
CAGAAGTACG GCCGCGAGCC CATCTCGCTG CACACCCCGC TGGGCGAGGA CGGCGACAGC 
GAGTTCGGCG ACCTCATCGA GGACTCCGAG GCGGTCGTGC CCGCGGACGC CGTGAGCTTC 
ACGCTCCTGC AGGAGCAGCT CCACCAGGTG CTCGACACGC TCTCCGAGCG CGAGGCCGGT 
GTGGTGTCCA TGCGGTTCGG CCTCACCGAC GGCCAGCCCA AGACGCTCGA CGAGATCGGC 
AAGGTCTACG GCGTGACGCG CGAGCGGATC CGTCAGATCG AGTCGAAGAC GATGTCGAAG 
CTGCGCCACC CGTCGCGCTC GCAGGTGCTG CGCGACTACC TCGACTGA

Protein sequence

MRGRTHGSVD TASVRAACEA AGVEGPKRLR AVVRGLGTAG VDVNDLGTAG RAVAATSAKS 
RPAAKATVAD AGTPAVRSTR TTKAAATKAT ATKTATAKKA ASKASPATES DVADEPVDEV 
EEDVDVTELE DVEVTDADVE TDDVEDVAED DAEETETKPA AAKKEDEPED TGFVYSDADD 
DDAPAQQVVT AGATADPVKD YLKQIGKVAL LNAEQEVELA KRIEAGLFAE EKLAETRDSL 
EPKLRRELEW IAQDGRRAKN HLLEANLRLV VSLAKRYTGR GMLFLDLIQE GNLGLIRAVE 
KFDYTKGYKF STYATWWIRQ AITRAMADQA RTIRIPVHMV EVINKLARVQ RQMLQDLGRE 
PTPEELAKEL DMTPEKVVEV QKYGREPISL HTPLGEDGDS EFGDLIEDSE AVVPADAVSF 
TLLQEQLHQV LDTLSEREAG VVSMRFGLTD GQPKTLDEIG KVYGVTRERI RQIESKTMSK 
LRHPSRSQVL RDYLD