Gene Cfla_1745 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cfla_1745
Symbol
ID	9145634
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cellulomonas flavigena DSM 20109
Kingdom	Bacteria
Replicon accession	NC_014151
Strand	+
Start bp	1943646
End bp	1944821
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	71%
IMG OID
Product	glycosyl transferase family 2
Protein accession	YP_003636841
Protein GI	296129591
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.298658
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.00455743
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGACCGCAA CGCCCGAACC GACGGGGGCG CTCGTCACCG TCATCGTCCC GACGTTCAAC 
GAGGCCCCGA ACGTGGCCGA GCTGGTGCGC CGCGTGGGTG CGGCGACGCG CGGCCTCGGG 
GTCGAGATGC TGTTCGTGGA CGACTCGACG GACGACACCG CCGACGTCGT GCGGGCCGTG 
GCCCCCACGG CTGAGCTGCC CGTACGCGTG ATCCACCGTG ACGACCCGGT CGGCGGCCTC 
GGCGGCGCCG TGCTCGAGGG TGTGCGGGCC TCGTCGACGC CGTACTTCCT CGTGATGGAC 
GGTGACCTGC AGCACCCGCC CGAGCTCATC CCGAGCCTCG TCGCGCGGGT CCAGGAGGTC 
GACGTGGACG TCGTCGTCGC GTCGCGCTAC ATCGGTGACG GGTCCAGCGC GGGGCTCTCC 
GGCGCCGTGC GCCAGGCCGT CTCCTCGACG TCGACCGCCG TGACCCGCGC CATGTTCCCC 
GTCCGGCTGC GTGACTGCTC CGACCCGATG ACCGGGTTCT TCGCGGTGCG CAGGGCGGCC 
GTCGACCTCG ACTCGCTGCG CCCGCGCGGC TTCAAGATCC TGCTCGAGAT CCTCGCGCGC 
CACCCCATGC GCGTCGTCGA GGTCCCGTTC GTGTTCGGCT CGCGCTACGC CGGGGAGTCC 
AAGGCGAACC TCGCCCAGGG CATCCACTTC ATGTGGCAGC TCGCCGGCCT GCGGTTCGGT 
CGCATGTCGC GGTTCGCGAT CATCGGCGGC ATGGGCGCGG TCGCGAACAT CGCGATCGTG 
TGGCTGCTGA CGAGGTTGGG GGCGCCCTGG CTCCTCGCCG CGATCGTCGC CGCCGAGCTC 
ACCATCGTCG GGAACTTCCT GCTGCAGGAG CGCTTCGTCT TCCGGGACCT CCGTCACGAG 
GGCAAGGGTG TCTGGGCGAG GTTCGGGCAG TCCTTCACGT TCAACAACGT GGAGACGCTC 
GTCCGCATGC CGGTCATGGC GCTGCTCGTC GAGACGATGC ACGTCGCCGC CGTCCTGGCC 
ACGGCCATCA CGATCGCGAT CGCGTTCGTC GTCCGGTTCA CGTTCCACTC GCGGATCGTC 
TACCGCCCGC GCCAGTCGAG CGTGCGGGCC CACCTCGTCG CGCGAGAGGC GGACAACGCC 
GAGCCACCGC CCCTGCCGCG CGCGGAGACC GTCTGA

Protein sequence

MTATPEPTGA LVTVIVPTFN EAPNVAELVR RVGAATRGLG VEMLFVDDST DDTADVVRAV 
APTAELPVRV IHRDDPVGGL GGAVLEGVRA SSTPYFLVMD GDLQHPPELI PSLVARVQEV 
DVDVVVASRY IGDGSSAGLS GAVRQAVSST STAVTRAMFP VRLRDCSDPM TGFFAVRRAA 
VDLDSLRPRG FKILLEILAR HPMRVVEVPF VFGSRYAGES KANLAQGIHF MWQLAGLRFG 
RMSRFAIIGG MGAVANIAIV WLLTRLGAPW LLAAIVAAEL TIVGNFLLQE RFVFRDLRHE 
GKGVWARFGQ SFTFNNVETL VRMPVMALLV ETMHVAAVLA TAITIAIAFV VRFTFHSRIV 
YRPRQSSVRA HLVAREADNA EPPPLPRAET V