Gene Cfla_3547 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cfla_3547
Symbol
ID	9147463
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cellulomonas flavigena DSM 20109
Kingdom	Bacteria
Replicon accession	NC_014151
Strand	+
Start bp	3936694
End bp	3937824
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	72%
IMG OID
Product	Endo-1,4-beta-xylanase
Protein accession	YP_003638618
Protein GI	296131368
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0132087
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAGCAC CGAGGCTCGT CCGGGACGGG GCCGCGCTGG GCGTCGCCGC CGCCCTCGCC 
GTCGGCGGTT GCACCGCCGG CGAGACGTCC CCCACGCCCA GCCCCACGCC GACCCCCGCG 
TCGACAGCCG ACGTGGCGCT GCGCGACGTC GCCCGGGACG GCCTGGCCGT CGGTGTGGCC 
GTCGCGGGCG GCGGGCACTA CGCGGCGTCC GGCTACCCCG ACCCGTTCGG TGCGGACGAG 
GCGTACCGCG ACGTCATCGC CGAGCAGTTC TCGTCCGTGA CCCACGAGAA CCAGCTGAAG 
TGGGAGTTCG TCCGGCCCAC GCGCGACGAG TTCCGGTTCG AGGGCGCCGA CGCGGTGATC 
GAGTTCGCCG AGGAGAACGG CCAGGTGGTG CGCGGGCACA CGCTGCTGTG GCACTCGCAG 
AACCCGCGCT GGCTGACGAG CGGCGAGTTC ACCGACGACG AGATGCGGGC CCTGCTGCAG 
GAGCACATCG CCACCGTCGT CGGCCGGTAC AAGGGCCGGA TCGTGCACTG GGACGTCGCC 
AACGAGATCT TCGACGACTC CGGCGTGCTG CGCACCGAGG AGAACCCGTT CCTCGCGCGG 
TTCGGCACGG ACATCGTCGC CGACGCCCTG CGCTGGGCCC ACGAGGCCGA CCCCGACGCG 
GTGCTGTACC TCAACGACTT CAACGTCGAG TCGATCGGCC GCAAGTCCGA CGCGTACTAC 
GCACTCGCCC AGGAGCTGCT GGCGCAGGGC GTCCCGCTGC ACGGGTTCGG CGTGCAGGGG 
CACCTGTCGA CGCAGTACCC GTTCCCGGAC GACCTCGAGG ACAACCTGCG ACGGTTCACC 
GACCTGGGCC TGGAGGTCGC GATCACCGAG CTCGACGTGC GCGTGCCCGT CGACGCCGAG 
GGCAAGCCCG ACGACGTCGA CGTCGACAAG CAGGTCGACT ACTACCGGCG GGCCGTCGGG 
GCGTGCGTCG CGGTCGAGCG CTGCACGTCG CTGACCCTGT GGGGCGTGAC CGACGCCTAC 
TCGTGGGTGC CCGGCTTCTT CACCGGCGAG GGCTCCGCCC TGGTCCTCGA CGAGGACTTC 
CACGCCAAGC CCGCGTTCAC GGCCGTCGCG GAGGCGCTGG CCGGCGAGTA A

Protein sequence

MRAPRLVRDG AALGVAAALA VGGCTAGETS PTPSPTPTPA STADVALRDV ARDGLAVGVA 
VAGGGHYAAS GYPDPFGADE AYRDVIAEQF SSVTHENQLK WEFVRPTRDE FRFEGADAVI 
EFAEENGQVV RGHTLLWHSQ NPRWLTSGEF TDDEMRALLQ EHIATVVGRY KGRIVHWDVA 
NEIFDDSGVL RTEENPFLAR FGTDIVADAL RWAHEADPDA VLYLNDFNVE SIGRKSDAYY 
ALAQELLAQG VPLHGFGVQG HLSTQYPFPD DLEDNLRRFT DLGLEVAITE LDVRVPVDAE 
GKPDDVDVDK QVDYYRRAVG ACVAVERCTS LTLWGVTDAY SWVPGFFTGE GSALVLDEDF 
HAKPAFTAVA EALAGE