Gene Cfla_2010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cfla_2010
Symbol
ID	9145905
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cellulomonas flavigena DSM 20109
Kingdom	Bacteria
Replicon accession	NC_014151
Strand	-
Start bp	2238612
End bp	2239859
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	76%
IMG OID
Product	cysteine/1-D-myo-inosityl 2-amino-2-deoxy-alpha- D-glucopyranoside ligase
Protein accession	YP_003637104
Protein GI	296129854
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTCAGCT GGCCCGCGCC CCAGATCCCT CGGCTGCCCG GGACCGGTGA GCCGGTCCGT 
GTGCTCGACA CCGCCACCGG GCGCCTCGTC GTGGCCGCGA CCGGCCCCCA CGCCCGCCTG 
TACGTGTGCG GCATCACCCC CTACGACGCG ACCCACCTCG GCCACGCGTC CACGTACGTC 
GCCTTCGACG TCCTCGTGCG CGCATGGCTC GACGAGGGCA AGACCGTCAC CTACGCGTCG 
AACGTCACCG ACGTCGACGA CCCGCTGCTC GAGCGCGCCA CGGCCACAGG CGTCGACTGG 
CGCGACCTCG CGGCGCAGCA GACCGCGCTG TACGCGTCCG ACATGACGAC GCTCGGGGTC 
GTGCCCCCGG ACGTCTACCG CGGCGTCGTG GAGTCCGTGC CACAGGTCGT CGCGGCCGTC 
GACGCGCTCC TCTCGCGCGA CGCCGCCTAC CGGCTGCCCG CCCCGGACGG CGGCGACGAC 
GTGTACGCCG ACCTGTCCGC CGATCCGGGT TTCGGCTCCG TCGCCGGGCT CGAGCACGCG 
GCGATGCTGG CACTGAGCGC CGAGCGTGGC GGCGACCCCG ACCGCCCGGG CAAGCGGTCG 
CCCCTCGACC CGCTGCTGTG GCGGGCCGAG CGCCCCGGCG AGCCCGCCTG GGACGCGCCG 
GGTCTCGGCC GTGGACGCCC GGGCTGGCAC GTGGAGTGCG CGGTCATCGC CTCCGACGGT 
CTCGGCGTGC CGTTCGACGT GCAGGGGGGC GGCTCCGACC TCGCGTTCCC GCACCACGAG 
TCGAGCGCGT CGCACCTGCG CGTGCTGACC GGGACGCCCC AGCCTGCCGC CGCGCACGTG 
CACACCGGGA TGGTGGGCTA CCGGGGCCAC AAGATGAGCA AGTCGCTCGG CAACCTCGTC 
CTCGTCTCGC AGCTGGTCGC CGACGGCGTC GAGCCCATGG CCGTGCGTCT CGCGGTGCTC 
GCGCACCGCT ACCGCTCGGA CTGGGAGTGG ACCGACGACG TGCTGGCCAC AGCGCAGCAG 
CGGGTCGCCA GGTGGCGGCG CGCCCTGTCC GGCAACGGCG GGCCGGCAGC CCAGCCGGTC 
CTCGACGGCG TGCGGGCGGC CGTCGCGGAC GACCTCGACA CCCCGCGGGC GCTCGCGGTC 
GTGGACGCGT GGGCAACCGC CGCCCTCGCC GGCGAGGTGC CGTTCGAGGA GGGCGCGCCC 
GGGGTCGTGG CGCGCACGGT CGACGCCCTG CTCGGCGTGC GCATGTGA

Protein sequence

MLSWPAPQIP RLPGTGEPVR VLDTATGRLV VAATGPHARL YVCGITPYDA THLGHASTYV 
AFDVLVRAWL DEGKTVTYAS NVTDVDDPLL ERATATGVDW RDLAAQQTAL YASDMTTLGV 
VPPDVYRGVV ESVPQVVAAV DALLSRDAAY RLPAPDGGDD VYADLSADPG FGSVAGLEHA 
AMLALSAERG GDPDRPGKRS PLDPLLWRAE RPGEPAWDAP GLGRGRPGWH VECAVIASDG 
LGVPFDVQGG GSDLAFPHHE SSASHLRVLT GTPQPAAAHV HTGMVGYRGH KMSKSLGNLV 
LVSQLVADGV EPMAVRLAVL AHRYRSDWEW TDDVLATAQQ RVARWRRALS GNGGPAAQPV 
LDGVRAAVAD DLDTPRALAV VDAWATAALA GEVPFEEGAP GVVARTVDAL LGVRM