Gene Cfla_1969 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cfla_1969
Symbol
ID	9145863
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cellulomonas flavigena DSM 20109
Kingdom	Bacteria
Replicon accession	NC_014151
Strand	-
Start bp	2191218
End bp	2193944
Gene Length	2727 bp
Protein Length	908 aa
Translation table	11
GC content	73%
IMG OID
Product	DNA polymerase I
Protein accession	YP_003637063
Protein GI	296129813
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.223022
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGTGCCG ACCAGCCAGC GACCAGCACC TCGACGACCC CGCGCCTGCT CCTCATCGAC 
GGGCACTCGA TGGCCTACCG CGCGTTCTTC GCGCTGCCGG TCGAGAACTT CTCGACGTCG 
TCCGGGCAGC CGACGAACGC GGTGTTCGGG TTCACCTCGA TGCTCGCCAA CCTGCTGCGC 
GACGAGGAGC CGACGCACGT GGCGGTCGCG TTCGACGCCG GGCGCACCAC GTTCCGCACC 
GAGCGGCTCG AGTCCTATAA GGGCAACCGC TCCGCGACGC CCGAGCCGTT CCGCGGCCAG 
GTCGACGTCA TCCGCCAGCT CCTCGCGACG ATGCACGTGC AGGTGCTCGA CAAGCCCGGC 
TTCGAGGCCG ACGACATCCT CGCGACCCTG ACGGCCCAGG CCGGCGAGCA GGGCATGGAG 
GTCCTCGTCT GCTCGGGCGA CCGTGACACG TTCCAGCTGG TCGGGCCGCA GGTCACCGTC 
CTGTACCCCG TGCGGGGCGT GTCGGAGATG TCGCGCATGA CCCCCGAGGC GGTCGAGGCG 
AAGTACGGTC TGCCGCCCGC GCGCTACCCG GACCTCGCCG CGCTCGTGGG GGAGACGAGC 
GACAACCTGC CCGGCGTCCC CGGCGTCGGC CCCAAGACGG CCGCCAAGTG GATCACGCAG 
TACGACGGCC TGGCCGGCGT GCTCGAGAAC GCCGAGCGCA TCACCGGCAA GGCCGGCGAG 
TCGCTGCGCG CGAACCTCGC GCAGGTCGCG CTCAACCGCG AGCTCAACGA GCTGCGGACC 
GACCTCGACC TGCCGCTCGG ACCCGAGGAC CTCGCGGTCC GCCCGTGGGA CCGGGCGGCC 
CTGCACCAGA TGCTCGACGA GCTCGAGTTC CGCACGCTGC GGGACCGGCT CTTCGCGATG 
CTCCCGGACG AGTCCCGTGA CGAGCGCGTC GCGACCGTCG CGGCGCTCGA CCTCGTCGAG 
ACGGGCGTGG GCGGTCTCGG TGCCTGGCTG GACGCGCGCG TCGACCAGGT CCTCGGCCTC 
GACGTGCGCG GAACGGGCGC CCCGGGGCGC GGTGACGCGT GGGGCGTCGC GGTCGCCGAC 
GGTGCCGGTC AGGCCGTGGC CTACGACCTC ACCGCGATCG ACCCTGCGGA CGAGACGGCT 
CTCGCCGCCT GGCTGGCGGA CCCGCAGCGA CCCAAGGCGC TGCACGCCGC CAAGGAGGCG 
TCGCACGCGC TCGCGGGCCG CGGCCTGGAC CTCGAGGGCG TCACGTTCGA CACCGAGCTG 
GCGGCGTACC TGTGCCAGCC GGACCGGCGC GCGTACGACC TGCCGGACCT CGCGATCGGC 
TACCTGCGCC GCGAGCTCGG TGGCGACGAC GGCTCGTCGG CCGGCCAGGG CGCGCTCGAC 
CTCGAGGTGG ACGGGGCCGA CGAGGGTCGC CGGGCCGCCG TGCGGGCCGC TGCCGTGCGG 
GACCTCGTCG ACGTCCTCGG CGGTGAGGTC GCCGATCGTG GGGCCACGAC GCTGCTGTCG 
GACCTCGAGC TCCCGCTGCA GGCCGTGCTC GCCCGCCTCG AGCGCACCGG CATCGCGATC 
GACCACGCGT ACCTCTCGGG ACTCGAGCGC GAGTTCGACG GCCAGGTGCA GGGGGCGGCC 
GCCGACGCGT ACGCGGTCAT CGGCCGCGAG GTGAACCTCG GCTCGCCGAA GCAGCTCCAG 
GAGGTGCTGT TCGACCAGCT CAGGATGCCG AAGACCAAGC GCATCAAGAC CGGCTACACG 
ACGGACGCCA ACGCCCTCAC CGACCTGTTC GCGCGCACCG GGCACCCCTT CCTCGAGCAC 
CTGCTGGCGC ACCGCGACGC CATCCGGCTG CGCCAGACGG TCGAGGGGCT GCTGCGGTCC 
GTCGCCGACG ACGGTCGCAT CCGCACGACG TTCCAGCAGA CCATCGCGGC GACCGGCCGG 
CTGTCCTCGG CGGACCCGAA CCTGCAGAAC ATCCCGATCC GCACCGACGC GGGCCGGCAG 
ATCCGCCGGG CATTCGTCGT GGGCCCCGGC TACGCGACGC TCCTGACCGC CGACTACTCC 
CAGATCGAGA TGCGCATCAT GGCGCACCTG TCGGGCGACG AGGGGCTCAT CGCGGCGTTC 
CGCTCGGGGG AGGACCTGCA CAGCTACGTG GGCTCGCGGG TGTTCGGCGT GCCCACGGAC 
GAGGTCACAC CGACGATGCG GTCGAAGATC AAGGCGATGA GCTACGGCCT GGCGTACGGC 
CTGTCGTCGT ACGGGCTCTC GCAGCAGCTC GCGATCGAGG TGTCGGAGGC GGCGGCGCTC 
ATGACGGACT ACTTCGAGCG GTTCGGCGGC GTGCGCGACT ACCTGACCGG CGTCGTGGAC 
CAGGCCCGCG CGACGGGCTA CACCGCGACG GTCCTCGGCC GACGCCGCTA CCTTCCGGAC 
CTCACGAGCG ACAACCGCCA GCGTCGCGAG GCCGCCGAGC GCATGGCGCT CAACGCGCCG 
ATCCAGGGCA GCGCGGCGGA CCTCATCAAG GTCGCGATGC TCGGCGTCGA CGGTGAGCTC 
ACCCGTCGGG GGCTGCGCTC GCGGATGCTC CTGCAGGTGC ACGACGAGCT GGTGCTCGAG 
GTCGCCGAGG GTGAGCGCGA GGAGGTCGAG GAACTCGTCC GGACGCAGAT GGCGGCGGCG 
GGCAGCGGCC TGCCCGACGG CCCGCTGGAC GTCCCCCTCG ACGTCTCCGT GGGCGTCGGC 
GAGAGCTGGC ACGCTGCCGG GCACTGA

Protein sequence

MSADQPATST STTPRLLLID GHSMAYRAFF ALPVENFSTS SGQPTNAVFG FTSMLANLLR 
DEEPTHVAVA FDAGRTTFRT ERLESYKGNR SATPEPFRGQ VDVIRQLLAT MHVQVLDKPG 
FEADDILATL TAQAGEQGME VLVCSGDRDT FQLVGPQVTV LYPVRGVSEM SRMTPEAVEA 
KYGLPPARYP DLAALVGETS DNLPGVPGVG PKTAAKWITQ YDGLAGVLEN AERITGKAGE 
SLRANLAQVA LNRELNELRT DLDLPLGPED LAVRPWDRAA LHQMLDELEF RTLRDRLFAM 
LPDESRDERV ATVAALDLVE TGVGGLGAWL DARVDQVLGL DVRGTGAPGR GDAWGVAVAD 
GAGQAVAYDL TAIDPADETA LAAWLADPQR PKALHAAKEA SHALAGRGLD LEGVTFDTEL 
AAYLCQPDRR AYDLPDLAIG YLRRELGGDD GSSAGQGALD LEVDGADEGR RAAVRAAAVR 
DLVDVLGGEV ADRGATTLLS DLELPLQAVL ARLERTGIAI DHAYLSGLER EFDGQVQGAA 
ADAYAVIGRE VNLGSPKQLQ EVLFDQLRMP KTKRIKTGYT TDANALTDLF ARTGHPFLEH 
LLAHRDAIRL RQTVEGLLRS VADDGRIRTT FQQTIAATGR LSSADPNLQN IPIRTDAGRQ 
IRRAFVVGPG YATLLTADYS QIEMRIMAHL SGDEGLIAAF RSGEDLHSYV GSRVFGVPTD 
EVTPTMRSKI KAMSYGLAYG LSSYGLSQQL AIEVSEAAAL MTDYFERFGG VRDYLTGVVD 
QARATGYTAT VLGRRRYLPD LTSDNRQRRE AAERMALNAP IQGSAADLIK VAMLGVDGEL 
TRRGLRSRML LQVHDELVLE VAEGEREEVE ELVRTQMAAA GSGLPDGPLD VPLDVSVGVG 
ESWHAAGH