Gene Cfla_2026 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cfla_2026
Symbol
ID	9145921
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cellulomonas flavigena DSM 20109
Kingdom	Bacteria
Replicon accession	NC_014151
Strand	-
Start bp	2256152
End bp	2257348
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	72%
IMG OID
Product	protein of unknown function UPF0118
Protein accession	YP_003637120
Protein GI	296129870
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGAGG TGTCCGAAGG GCGGTCGACC GGCGTCGCGT CCGCGTCGGC GCGCAAGGTC 
GCCGGCGGGC GCCGGAACCC GGCGGTGACC GGGCGCGACG ACCTGGCGCC CCGGTGGCTG 
CACCGGTCCG CGGGCGTCGC GTGGCGGCTG CTCGTCGTGC TCGCGGCCGT CGTCGTCGTG 
TTCTACGCGA CGTCCCGCGT GACTCTGGTG TTCGTCGCCG TGTTCCTCGC GCTCGTGTTC 
ACCGCCGTCC TGCGCCCGCT CGTCGAGGTC ATGTCGCGCG TGATGCCCCG CGGCCTGGCC 
ACCGCGTTCT CCCTGCTCGC TGGGATCCTG TTCTTCCTCG GCATGCTCAC GTACGTCGGC 
TACTCGATCG CGACGCAGTG GAACGACCTC AGCACGCAGT TCGCGGACGG CATCAACCAG 
ATCACCGACT TCCTCGAGAG CGGGTCGCTG CCGTTCACGA TCACCAGCGA GCAGATCGCC 
GAGTGGATCG ACACGGCGCT GGCCTGGGTG CAGGAGCACG CGGGCGACCT CGCCGGGCAG 
GCGGCCGCCA GTGCCGGCTC CGTGGTGGTC GGCTTCACCG CGGTGGCCCT GGCGATCTTC 
TGCTCGGTGT TCTTCCTGGC CCGCGGCGCA CAGCTGTGGA CGTGGTTCCT CAACCAGCTC 
CCGGCGCGCA CCCGCGCCAC GTGGCAGGTC GCCGGTGGCG CCGGGTGGTA CACGTTCTCG 
GGGTACACCC GCGGCACTGT CATCATCGCG CTCGTCGACG GCGTGCTGGC GTTCCTCCTG 
CTCAGCGTGC TCCGGGTCCC GCTCGCAGCG CCGCTCGCGG TGCTCGTGCT CATCGGCGCG 
TTCATCCCGC TGGTCGGTGC GCCCGGCGCG ATGATCGTCG CGATGATCGT CGCACTGGCT 
GCCAACGGGC TGTGGTCGGC GGTCGCCGTG GGCGTCGGCA TCGCGCTCAT CGGGCAGCTC 
GAGGGGCACG TGCTCCAGCC GCTCATCATG GGCAAGCAGG TGTCGCTGCA CCCGGTGGTG 
GTCGCGCTCG CGGTCACGGC GGGCACGCTC ACGGCAGGGA TCCTCGGGGC GGTCATCTCG 
GTGCCGCTCG TCGCCGTGGC GTGGGCCGTC TTCTCCCGGC TGCGGACGCT CGACCCACCG 
ATGGAGGAGG ACGAGGACGA GGTCACCGAC GCCGAACAGG GTGCCGATGC CCGCTGA

Protein sequence

MSEVSEGRST GVASASARKV AGGRRNPAVT GRDDLAPRWL HRSAGVAWRL LVVLAAVVVV 
FYATSRVTLV FVAVFLALVF TAVLRPLVEV MSRVMPRGLA TAFSLLAGIL FFLGMLTYVG 
YSIATQWNDL STQFADGINQ ITDFLESGSL PFTITSEQIA EWIDTALAWV QEHAGDLAGQ 
AAASAGSVVV GFTAVALAIF CSVFFLARGA QLWTWFLNQL PARTRATWQV AGGAGWYTFS 
GYTRGTVIIA LVDGVLAFLL LSVLRVPLAA PLAVLVLIGA FIPLVGAPGA MIVAMIVALA 
ANGLWSAVAV GVGIALIGQL EGHVLQPLIM GKQVSLHPVV VALAVTAGTL TAGILGAVIS 
VPLVAVAWAV FSRLRTLDPP MEEDEDEVTD AEQGADAR