Gene Cfla_2004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cfla_2004
Symbol
ID	9145899
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cellulomonas flavigena DSM 20109
Kingdom	Bacteria
Replicon accession	NC_014151
Strand	-
Start bp	2231668
End bp	2233302
Gene Length	1635 bp
Protein Length	544 aa
Translation table	11
GC content	69%
IMG OID
Product	AAA ATPase central domain protein
Protein accession	YP_003637098
Protein GI	296129848
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.36132
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAAC CCGCTGCCCC TGGACGCGAC CTGCACCGCG AGCTCGCGGT GCTCGCGGCG 
AAGAACGAGC GGCTCAGCGA GGCGCTCGTC GCCGCACGCG AGCAGATCCT CGATCTCAAG 
CGTCAGGTGG ACGACCTGGC CAAGCCGCCC GGGACGTACG CCACCTTCCT CGGCGCGCGC 
GCCGACGGCA CGGTCGACAT CGTCTCCGCC GGTCGCAAGA TGCACGTCGG CGCGAGCCCC 
TCGCTCGACG TCCACCACCT GCGGCCCGGG CAGGAGGTCA TGCTCAACGA GGCCCTCACG 
GTCGTCGAGG CCGGCGGCTA CGAGCAGGTC GGCGAGATCG TCACCGTCAA GGAGATGCTC 
GGCGAGGGGC GTGCCCTGGT GATCGGGCGT GGCGACGAGG AGCGGGTCGT GCGGTTCGCC 
GGCCAGGTGG CCGACACCGG CGTGCGCGTC GGCGACGCGC TGACGATCGA CCCGCGCAGC 
GGGTTCGTGT TCGAGGTGAT CCCGCGGGCC GAGGTCGAGG AGCTCGTGCT CGAGGAGGTC 
CCGGACATCG ACTACACGGA CATCGGTGGC CTGGGCCCGC AGATCGAGGC GATCCGCGAC 
GCCGTCGAGC TGCCGTTCCT GCACCCCGAG CTGTTCCGCG AGCACGGGCT CAAGCCGCCC 
AAGGGCGTGC TGCTCTACGG CCCGCCGGGA TGCGGCAAGA CGCTCATCGC CAAGGCCGTC 
GCGCACTCGC TGGCCGCGAC GGCGGCGGCA GCGCGCGGTG AGGACGTCGC CGACGCCCGC 
TCCTTCTTCC TCAACGTCAA GGGACCCGAG CTCCTCAACA AGTACGTCGG GGAGACCGAG 
CGGCACATCC GCCTGATCTT CGCCCGGGCG CGCGAGAAGG CGTCGCAAGG GCACCCGGTC 
GTCGTGTTCT TCGACGAGAT GGAGTCGCTG TTCCGCACCC GCGGCACCGG GGTGTCCAGC 
GACGTCGAGA CGACGATCGT GCCGCAGCTG CTCTCGGAGA TCGACGGCGT CGAGCGGCTC 
GACAACGTCA TCGTCATCGG CGCGTCGAAC CGCGAGGACA TGATCGACCC CGCGATCCTG 
CGCCCCGGCC GCCTGGACGT GAAGATCAAG ATCGAGCGGC CCGACGCGGA GGGCGCGCGG 
GAGATCTTCG CCAAGTACCT CACGCCGGAG CTGCCGATCC ACGCCGACGA CCTCGCCGAG 
CACGGCGGGT CGGGCCAGGC GGCCGTCGAG GCGATGATCC GGCGCGTCGT CGAGCGCATG 
TACTCCGAGT CCGACGAGAA CCGGTTCCTC GAGGTGACGT ACGCCAGCGG CGACAAGGAG 
GTCCTGTTCT TCAAGGACTT CAACTCCGGC GCGATGATCC AGAACGTCGT CGACCGTGCC 
AAGAAGTCCG CGATCAAGGA CCTCCTGGCC ACGGGACAGC GCGGCATCCG CGTCGACCAC 
CTGCTCTCGG CGTGCGTCGA CGAGTTCAAG GAGAACGAGG ACCTGCCCAA CACCACCAAC 
CCGGACGACT GGGCGCGGAT CTCCGGCAAG AAGGGCGAGC GGATCGTCTT CATCCGCACG 
ATCGTCCAGG GCAAGAAGGG TGTCGAGGCG TCGCGGACCA TCGAGAACGT GACGAGCACC 
GGCCAGTACC TGTGA

Protein sequence

MTEPAAPGRD LHRELAVLAA KNERLSEALV AAREQILDLK RQVDDLAKPP GTYATFLGAR 
ADGTVDIVSA GRKMHVGASP SLDVHHLRPG QEVMLNEALT VVEAGGYEQV GEIVTVKEML 
GEGRALVIGR GDEERVVRFA GQVADTGVRV GDALTIDPRS GFVFEVIPRA EVEELVLEEV 
PDIDYTDIGG LGPQIEAIRD AVELPFLHPE LFREHGLKPP KGVLLYGPPG CGKTLIAKAV 
AHSLAATAAA ARGEDVADAR SFFLNVKGPE LLNKYVGETE RHIRLIFARA REKASQGHPV 
VVFFDEMESL FRTRGTGVSS DVETTIVPQL LSEIDGVERL DNVIVIGASN REDMIDPAIL 
RPGRLDVKIK IERPDAEGAR EIFAKYLTPE LPIHADDLAE HGGSGQAAVE AMIRRVVERM 
YSESDENRFL EVTYASGDKE VLFFKDFNSG AMIQNVVDRA KKSAIKDLLA TGQRGIRVDH 
LLSACVDEFK ENEDLPNTTN PDDWARISGK KGERIVFIRT IVQGKKGVEA SRTIENVTST 
GQYL