Gene Cfla_2023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cfla_2023
Symbol
ID	9145918
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cellulomonas flavigena DSM 20109
Kingdom	Bacteria
Replicon accession	NC_014151
Strand	-
Start bp	2251323
End bp	2252588
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	75%
IMG OID
Product	DNA-directed DNA polymerase
Protein accession	YP_003637117
Protein GI	296129867
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.137176
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGCGCA TGCCCGGCGC GACGATCCTG CACGCCGACC TCGATGCGTT CTACGCGTCG 
GTCGAGCAGC TGCTGGACCC GCGCCTGCGT GGCCGACCCA TCGCGGTCGG GGGCAGTGCC 
GCGGGCGGCG TCGTCCTCGC CGCGTCGTAC GAGGCCAAGC GCTACGGGGT CTCCGGGGGG 
ATGCCCGGCT GGCGGGCCGC ACGACTGTGC CCGGGCCTGC AGTTCGTCCC CGGGCGCTTC 
CGGGAGTACC AGCCGATCGC CGACAGGGTC ATGGACGTCC TGGGTGACGT GACCCCGGTG 
GTGGAGCGGA TCTCGATCGA CGAGGCGTTC CTCGACGTCG CCGGCTCGAC CCACCTCTTC 
GGCACGCCGG CGCAGATCGC GGTGCTGCTG CGGCGCCGCG TGCGCGACGA GATCGGCCTG 
CCGATCTCGG TCGGGGTCGC CCGCACCAAG CACCTCGCCA AGATCGCGTC GCAGGTCGCC 
AAGCCCGACG GCCTCGTGGT CGTCGAGCCC GAGCGCGAGC GGGAGTTCCT CGAGCCGCTG 
CCGGTCGGTC TCATGTGGGG CGTGGGGCCC GTCGCGCGGG CGCGGCTCGC CGAGCGGGGC 
ATCACGACCA TCGGCGAGCT GGCGCGCACA CCGACGGGCG CGGTCGAGAA GATCCTCGGG 
CACGCCGTCG GGTCGCGGAT GTCCGCGCTG GCGCACAACG AGGACCCGCG TCGGGTCGCC 
GGGGCGGGTC GTGCCCGGTC GGTGGGGGCG CAGTCGGCCC TCGGCCGGCA GCAGGCGACG 
CCCGAGCTCG TGCGCGAGGT GCTCGCCCAG CTCGCCGACC GCGTCGCGGG CCGCATGCGT 
GCCAAGGGGC GCGCGGGGCG CACGGTCACC GTGCGCGTGC GGTTCCCCGG CATGCGCTCG 
GTCACGCGCT CGCACACGCT TCCCGGGCCG GTCGCCACGA CGCTCACCCT CACCGAGGTC 
GCCGAGCAGC TCGTGTGGCA GGCGATCCGC GAGCAGCCGC ACCCCGAGCC CGACGTGACC 
CTGCTCGCGA TCTCCGTGTC GGGCCTGGTC GAGCAGTCCT CGCTGCAGCT CGAGCTGCCG 
CTGCTCACCG CCGACCCACG TCGCCCGGGA TCGGCGCCGG GTGCGGCCCG CTGGGCGGTC 
GACCGCTCGG TCGACGCGGT GCGTGCGCGC TTCGGCAACG CCGCGGTGGG CTACCTGCCG 
ACCGCCATGC CACGCGTGCG CACGGTGCCG GACGAGTTCC GCGAGCTCGC GGAGCACGAC 
CTGTGA

Protein sequence

MRRMPGATIL HADLDAFYAS VEQLLDPRLR GRPIAVGGSA AGGVVLAASY EAKRYGVSGG 
MPGWRAARLC PGLQFVPGRF REYQPIADRV MDVLGDVTPV VERISIDEAF LDVAGSTHLF 
GTPAQIAVLL RRRVRDEIGL PISVGVARTK HLAKIASQVA KPDGLVVVEP EREREFLEPL 
PVGLMWGVGP VARARLAERG ITTIGELART PTGAVEKILG HAVGSRMSAL AHNEDPRRVA 
GAGRARSVGA QSALGRQQAT PELVREVLAQ LADRVAGRMR AKGRAGRTVT VRVRFPGMRS 
VTRSHTLPGP VATTLTLTEV AEQLVWQAIR EQPHPEPDVT LLAISVSGLV EQSSLQLELP 
LLTADPRRPG SAPGAARWAV DRSVDAVRAR FGNAAVGYLP TAMPRVRTVP DEFRELAEHD 
L