Gene Cfla_0653 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cfla_0653
Symbol
ID	9144523
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cellulomonas flavigena DSM 20109
Kingdom	Bacteria
Replicon accession	NC_014151
Strand	+
Start bp	708460
End bp	709791
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	77%
IMG OID
Product	UDP-N-acetylglucosamine
Protein accession	YP_003635764
Protein GI	296128514
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.119521
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000107829
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGACCACCG ACCGGGCGCC GCGCGTCGCC ATGCTCTCGG TCCACACGTC CCCCCTCGAC 
CAGCCCGGCA CGGGCGACGC GGGCGGCATG AACGTGTACG TCCTGGAGCT CGCGCACGCG 
CTGGCCGCGC GTGGGGCCCG GGTCGAGGTC TTCACGCGCG CGACGCGGTC CGACGTGCCG 
GAGACGGTCG TCCTCGACGG CGTCGACGCC GCGGGGCGCG CCCTGACGGC CGACGACGCG 
CGCGACGTGC TGCTCGCGCA CGACGTGCCG CCGGGCGTCA CGCCGCCCGT GCTCGTCCAC 
CACGTGCCTG CGGGCCCGTT CGAGGCGCTC GACAAGAACG ACCTGCCGGG CGTGCTGTGC 
GGCATGGCCG CGGGCGTCCT GCGCTCCGAG GCGGCGCGCC GTCCCGGCTG GTACGACGTC 
GTGCACTCCC ACTACTGGCT GTCCGGGCAG GTCGGCGCGA TCGCGGCGCA GCGCTGGGAG 
GTGCCGCTCG TGCACACCGC GCACACCCTC GCCAAGGTGA AGAACGCGTC GCTCGGGCCG 
GGGGACAGCG CCGAGCCGAG CGTGCGCGTC GTGGGCGAGG AGCAGGTCGT CGCGGACGCC 
GACGCGCTCG TCGCGTCCAC GCCCGTGGAG GCGCGTGAGC TCGTCGAGCT GTACGGCGCC 
GACCCGGCGC GCGTGCACGT CGTCGAGCCG GGCGTCGACC TCGAGCGGTT CCGTCCCGGC 
GGCCCGGGCG CGCGCGACGA GGCGCGACGG CGGCTCGGTC TGCCGACCGA CCGGCCGGTC 
GTGCTGTTCG CCGGGCGCGT GCAGCCGCTC AAGGCGCCGG ACGTGCTGGT GCAGGCGGTC 
GGGGTGCTGC GTGCGAGCGG GCGGCCCGTC CCGCTGCTCG TCGTGCTCGG CGGCCCGTCG 
GGCCGGCCGA CGGCGGTGCG TGAGCTGCGC GCCCTGGCCG TGACGCTCGG GGTCGACGAC 
GACGTGGTCG TGCGCCCGCC CGCGCCGCGT GACGAGCTCG TCTCCTGGTA CCGCGCGGCG 
GACCTCGTCG CGATGCCGTC GCGCTCGGAG TCGTTCGGGC TGGTCGCCGT CGAGGCGCAG 
GCCAGCGGCA CGCCGGTGCT GGCGGCCGAC GTCGGCGGCC TGCGGACCGT CGTCGAGGAC 
GACGTCTCCG GTCGCCTCGT GCCGGGCCAC GACCCTCAGG TGTGGGCCGA GGTGATCGCC 
GACGCGCTCG CTGACGCCCC GCGCCGCGCC CGCTGGGCCG CCGGCGCCCG TCAGGTGGCC 
GAGCGTTACG CGTGGACCAC GGCCGCCGAC CAGGTGCTCA AGGTCTACGC GGTCGCCGCC 
GAGCCCCGCT GA

Protein sequence

MTTDRAPRVA MLSVHTSPLD QPGTGDAGGM NVYVLELAHA LAARGARVEV FTRATRSDVP 
ETVVLDGVDA AGRALTADDA RDVLLAHDVP PGVTPPVLVH HVPAGPFEAL DKNDLPGVLC 
GMAAGVLRSE AARRPGWYDV VHSHYWLSGQ VGAIAAQRWE VPLVHTAHTL AKVKNASLGP 
GDSAEPSVRV VGEEQVVADA DALVASTPVE ARELVELYGA DPARVHVVEP GVDLERFRPG 
GPGARDEARR RLGLPTDRPV VLFAGRVQPL KAPDVLVQAV GVLRASGRPV PLLVVLGGPS 
GRPTAVRELR ALAVTLGVDD DVVVRPPAPR DELVSWYRAA DLVAMPSRSE SFGLVAVEAQ 
ASGTPVLAAD VGGLRTVVED DVSGRLVPGH DPQVWAEVIA DALADAPRRA RWAAGARQVA 
ERYAWTTAAD QVLKVYAVAA EPR