Gene Cfla_0141 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cfla_0141
Symbol
ID	9144006
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cellulomonas flavigena DSM 20109
Kingdom	Bacteria
Replicon accession	NC_014151
Strand	+
Start bp	172225
End bp	173799
Gene Length	1575 bp
Protein Length	524 aa
Translation table	11
GC content	73%
IMG OID
Product	peptidase M28
Protein accession	YP_003635259
Protein GI	296128009
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.481582
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCAGCTC GACGTACCAC CGTGCTCGCC GGCACGCTCG CGACCCTCGT GCTCGGGACC 
AGTGCACTGC TCGCCCCACC CGCCCTCGCC CACGGGCCCG GTGGCAGGCC CGGGCCGGGG 
CACGGCCCGG GCCACGCGGT CGACGCGGAG AGGTTCGCCC GGCAGGTGAC GACGCGCGGC 
GTCTGGCGGC ACCTCGAGGA GCTCCAGCGC ATCGCGGACC GGCACGACGG CAACCGTGCT 
GCCCTCACCG AGGGCTACGA GGCGAGTGCG CGCTACGTCG AGCGGACGCT GAAGCGCGCC 
GGCTACGAGG TCACGCGCGA CCCGTTCACG TTCGGCTTCG AGGTCATCGA CGCCGAGGCG 
CTCACGCTGG GCACGGGCGA GACGTTCGCG GTCGACCAGA TGCAGTACGC GCCGAGCACG 
GCGGAGGGCG GCGTGACGGC GCCCGGGTCG GTGCCGAACG ACGTCACGGG CTGCACGGCC 
GACTCGTGGG CGGGCGTCGA GGCGACCGGG ACGATCGCGG TCATCAGCCG CGGCGCGTGC 
TCGTTCGCCG AGAAGGCGAT CGCGGCGCAG GCCGCGGGTG CGATCGGCGC CGTCGTCTAC 
AACAACGTCG AGGAGATGCT GTTCGGCACG CTCGGCGAGG AGGGGCTCGT CGACATCCCC 
GTCGCGGGCG CCGGCCAGGC CGACGGGGCG GCGATCGTCG CGGCCGTCGC CGCCGGGACG 
CCGCTGACGC TCGAGGTCCG CTACCACGTC GAGGAGGAGG AGAGCTTCAA CGTCATCGCG 
GAGACGAAGG CCGGGCGCGA CGACAACGTC GTCGTGCTGG GCGCGCACCT CGACGGCGTG 
GAGGACGGCC CCGGCCTCAA CGACAACGGG TCGGGCTCGG CGGTGCTGCT GGAGGTCGCC 
GTCCAGCTCG CGAAGCAGAA GAAGCTCAAC AACACCGTGC GGTTCGCGTG GTGGGGCGCC 
GAGGAGCTCG GGCTGATCGG CTCGACCGCG TACGTCGAGG AGCTCGCGGG CCAGGAGGGC 
GAGCTCGACC GCATCGCCAC GTACCTCAAC TTCGACATGG TCGGCTCGCC GAACTACGTC 
ATCGGCGTGT ACGACGCGGA CCAGTCGACG TACGAGGCGC CGGTGGACGT CCCGCCGGGC 
TCGGCGGAGA CGGAGGCGGT CTTCACCGGC TACTTCGACT CCCGCGACCA GGCGTGGGTC 
GACACCGAGT TCTCCGGCCG GTCCGACTAC CAGGCGTTCA TCCTCAACGG CGTCCCCGCG 
TCCGGCCTCT TCACGGGCGC GGACGACATC AAGACCGACG AGGAGGTCGC GCTGTTCGGC 
GGCACGGCCG GCATCCGGCA CGACCCGAAC TACCACACGC CGGCGGACGA CCTGTCCAAC 
GTGAGCCGCG AGGCGATCGG GATCATGGCG CCGGCGGTCG CGTTCGCGAC GGCGAGCCTC 
GCGACGGACA CGTCGGCGAT CAACGGGGTC TCGGGCCCGG GCGACCAGGG GCACCACCAC 
GGGCCGTCGC ACCACGGCAA GGGCCGTGCG CCGCACCACG GGCACGAGCA CGGAGGCCTG 
CTGAAGGCGT CGTGA

Protein sequence

MAARRTTVLA GTLATLVLGT SALLAPPALA HGPGGRPGPG HGPGHAVDAE RFARQVTTRG 
VWRHLEELQR IADRHDGNRA ALTEGYEASA RYVERTLKRA GYEVTRDPFT FGFEVIDAEA 
LTLGTGETFA VDQMQYAPST AEGGVTAPGS VPNDVTGCTA DSWAGVEATG TIAVISRGAC 
SFAEKAIAAQ AAGAIGAVVY NNVEEMLFGT LGEEGLVDIP VAGAGQADGA AIVAAVAAGT 
PLTLEVRYHV EEEESFNVIA ETKAGRDDNV VVLGAHLDGV EDGPGLNDNG SGSAVLLEVA 
VQLAKQKKLN NTVRFAWWGA EELGLIGSTA YVEELAGQEG ELDRIATYLN FDMVGSPNYV 
IGVYDADQST YEAPVDVPPG SAETEAVFTG YFDSRDQAWV DTEFSGRSDY QAFILNGVPA 
SGLFTGADDI KTDEEVALFG GTAGIRHDPN YHTPADDLSN VSREAIGIMA PAVAFATASL 
ATDTSAINGV SGPGDQGHHH GPSHHGKGRA PHHGHEHGGL LKAS