Gene Cfla_1501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cfla_1501
Symbol
ID	9145387
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cellulomonas flavigena DSM 20109
Kingdom	Bacteria
Replicon accession	NC_014151
Strand	+
Start bp	1664384
End bp	1665544
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	71%
IMG OID
Product	1-hydroxy-2-methyl-2-(E)-butenyl 4-diphosphate synthase
Protein accession	YP_003636598
Protein GI	296129348
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCACCC CGATCAGCCT CGGCATGCCG CAGGCGCCTG CCCCCGTGCT GGCCCCGCGG 
CGAGCGTCCC GCAAGATCCG CGTCGGCAAG GTCGAGGTCG GGGGCGACGC CCCGGTCTCG 
GTGCAGTCGA TGACGACGAC CCCGACGACC GACGTCAACC GCACGCTGCA GCAGATCGCC 
GAGCTGACGG CCTCCGGCTG CGACATCGTG CGCGTGGCCG TGCCGAGCCA GGACGACGCC 
GAGGCGCTGC CTGCGATCGC GCGCAAGTCC CAGATCCCGG TGATCGCGGA CATCCACTTC 
CAGCCGAAGT ACGTCTTCGC GGCCATCGAC GCCGGTTGCG CCGCGGTGCG GGTGAACCCT 
GGCAACATCC GCAAGTTCGA CGACCAGGTC AAGGAGATCG CGCAGGCCGC CACCGACGCC 
GGGGTCTCGA TCCGGATCGG CGTCAACGCC GGCTCGCTCG ACCCCCGCCT GCTCGCCAAG 
TACGGCAAGG CGACGCCCGA GGCGCTCGTC GAGTCGGCCG TGTGGGAGGC GTCCCTGTTC 
GAGGAGCACG GCTTCCGCGA CTTCAAGATC AGCGTCAAGC ACAACGACCC GGTCGTGATG 
GTGCGCGCCT ACGAGCTGCT CGCCGAGCGG GGCGACTGGC CGCTGCACCT CGGTGTGACG 
GAGGCGGGCC CGGCGTTCCA GGGCACCATC AAGTCGGCGA CGGCCTTCGG GGCCCTGCTG 
AGCAAGGGCA TCGGCGACAC CATCCGCGTG TCCCTGTCGG CTCCTCCCGT CGAGGAGGTC 
AAGGTCGGCA TCCAGATCCT GCAGTCGCTG AACCTGCGCC CGCGCAAGCT CGAGATCGTG 
TCGTGCCCCT CGTGCGGGCG TGCTCAGGTC GACGTCTACA CGCTCGCCGA GAAGGTCACC 
GCCGGGCTCG AGGGCATGGA GGTGCCGCTG CGCGTCGCGG TCATGGGGTG CGTCGTCAAC 
GGGCCGGGTG AGGCGCGCGA GGCCGACCTC GGCGTCGCCT CCGGCAACGG CAAGGGCCAG 
ATCTTCGTCA AGGGCGAGGT CGTCAAGACC GTGCCCGAGT CGATGATCGT CGAGACCCTC 
ATCGAGGAGG CCATGCGCCT CGCCGAGACC ATGGACCCCG TCGAGGCGGG CGAGGGCGCG 
CCCGTGGTGA GCGTCGGCTG A

Protein sequence

MSTPISLGMP QAPAPVLAPR RASRKIRVGK VEVGGDAPVS VQSMTTTPTT DVNRTLQQIA 
ELTASGCDIV RVAVPSQDDA EALPAIARKS QIPVIADIHF QPKYVFAAID AGCAAVRVNP 
GNIRKFDDQV KEIAQAATDA GVSIRIGVNA GSLDPRLLAK YGKATPEALV ESAVWEASLF 
EEHGFRDFKI SVKHNDPVVM VRAYELLAER GDWPLHLGVT EAGPAFQGTI KSATAFGALL 
SKGIGDTIRV SLSAPPVEEV KVGIQILQSL NLRPRKLEIV SCPSCGRAQV DVYTLAEKVT 
AGLEGMEVPL RVAVMGCVVN GPGEAREADL GVASGNGKGQ IFVKGEVVKT VPESMIVETL 
IEEAMRLAET MDPVEAGEGA PVVSVG