Gene Cfla_1835 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cfla_1835
Symbol
ID	9145728
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cellulomonas flavigena DSM 20109
Kingdom	Bacteria
Replicon accession	NC_014151
Strand	+
Start bp	2046702
End bp	2047823
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	74%
IMG OID
Product	3-dehydroquinate synthase
Protein accession	YP_003636931
Protein GI	296129681
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.233017
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.221025
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACG CGTCCGTCGT CCGGGTCGCC GGCGAGCAGC CGTACGACGT CGTCATCGGG 
CGCCACCTCC TCGGGCACCT GACCGGCATG CTCGGCGAGG GCGTGCGCCG CGTGCTCGTC 
GTACATCCGG CGGCGCTCGC GACGTCCGCC GAGACCGTCC GCGCGGACCT CGTGGCCGCC 
GGCTACGAGG TGTACCTCGC GCAGGTCCCC GACGCCGAGG AGCAGAAGAC CGCGCAGGTC 
GCCGCCTTCT GCTGGGGTGT GCTCGGCCAG GCCGACTTCA CGCGCTCCGA CGCCGTCGTC 
GGCCTCGGCG GGGGAGCGAC CACCGACCTC GCCGGGTTCG TGGCCGCCAC CTGGCTGCGC 
GGCGTGCGCG TCGTGCAGGT CCCCACCACC GTGCTGGCGA TGGTCGACGC GGCGGTCGGC 
GGCAAGACCG GCATCAACAC CGCCGAGGGC AAGAACCTCG TCGGGGCGTT CCACCCGCCG 
GCCGGCGTGC TGTGCGACCT CGCGGCCGTC GAGTCGATGG TGCCGAACGA CTTCGTCGCC 
GGGCTCGCCG AGATCGTCAA GTGCGGGTTC ATCGACGACC CCCGCATCCT CGAGCTCGTC 
GAGGAGCACA CCGCCCTGCT GCTGGACCCC GTCGCCGCCG CGTCGTCGCC CGTGCTCGCG 
GAGCTCGTCG AGCGGGCCGT GCGCACCAAG GCGCGCGTCG TGGGGGAGGA CCTGCGCGAG 
GCCGGCCTGC GCGAGATCCT CAACTACGGC CACACGTTCG GCCACGCGGT CGAGCACGTC 
GAGCGGTACC GCTGGCGCCA CGGCGCCGCC GTGTCGGTCG GCATGGTGTT CGTCGCCGAG 
CTCGCGCGCC TCGCCGGGCG CCTGGACGAC GCGGTCGTCG AACGCCACCG CAGCGTGCTC 
ACCTCGCTGG GCCTGCCGAC GACGTACCGG GCAGACCGGT GGGAGCAGCT GCTCACCGCC 
ATGCGCCGCG ACAAGAAGAC CCGGGGCGAC CTCCTGCGCT TCGTGGTCCT CGAGGACCTC 
GCGAGGCCGG CGCGTCTGGA AGGCCCCGAC CCCACCCTCC TCGCCGCCGC CTACGCCGAG 
ATCTCCGCGA CCCCGCAGCG GACGAGCGGC ATCCTGCTCT GA

Protein sequence

MSDASVVRVA GEQPYDVVIG RHLLGHLTGM LGEGVRRVLV VHPAALATSA ETVRADLVAA 
GYEVYLAQVP DAEEQKTAQV AAFCWGVLGQ ADFTRSDAVV GLGGGATTDL AGFVAATWLR 
GVRVVQVPTT VLAMVDAAVG GKTGINTAEG KNLVGAFHPP AGVLCDLAAV ESMVPNDFVA 
GLAEIVKCGF IDDPRILELV EEHTALLLDP VAAASSPVLA ELVERAVRTK ARVVGEDLRE 
AGLREILNYG HTFGHAVEHV ERYRWRHGAA VSVGMVFVAE LARLAGRLDD AVVERHRSVL 
TSLGLPTTYR ADRWEQLLTA MRRDKKTRGD LLRFVVLEDL ARPARLEGPD PTLLAAAYAE 
ISATPQRTSG ILL