Gene Cfla_2051 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cfla_2051
Symbol
ID	9145947
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cellulomonas flavigena DSM 20109
Kingdom	Bacteria
Replicon accession	NC_014151
Strand	-
Start bp	2290501
End bp	2291820
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	73%
IMG OID
Product	band 7 protein
Protein accession	YP_003637145
Protein GI	296129895
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.471473
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGACG GCCCCGGTGC CGGCCAGATC GCTGCGATCC TGGTGCTCGT CCTCGTCCTG 
ATCTTCGTCG TGGTCGCGCT GGCGCGCGCG GTGCGGATCG TGCCCCAGGC GGTGGCGATC 
ATCGTCGAGC GGCTCGGGCG CTACAACAAG ACGCTCGACG CCGGTCTGCA CCTGCTGATC 
CCGTTCGTGG ACCGTGTGCG CGCGAACGTC GACCTGCGCG AGCAGGTCGT GTCCTTCCCG 
CCGCAGCCCG TGATCACCTC CGACAACCTC GTCGTGAGCA TCGACACGGT CATCTACTTC 
CAGGTGACCT CGCCGAAGGA CGCGGTCTAC GAGATCGCCA ACTACATCAC CGGCATCGAG 
CAGCTCACCG TCACGACGCT CCGCAACGTC ATCGGTTCCA TGGACCTGGA GCAGACGCTG 
ACGAGCCGCG ACCAGATCAA CGGTCAGCTG CGCGGCGTGC TCGACGAGGC GACCGGCAAG 
TGGGGCATCC GCGTCAACCG CGTCGAGCTC AAGGCGATCG ACCCGCCCGC GTCGGTGCAG 
GGCTCGATGG AGCAGCAGAT GCGGGCCGAG CGGGACCGTC GCGCCGCGAT CCTCACGGCC 
GAGGGTGTCA AGCAGTCCGC GATCCTCACG GCCGAGGGCG AGAAGCAGTC GGCGATCCTG 
CGGGCCGAGG GTGAGGCGCA GTCGGCCATC CTGCGGGCCG AGGGTGAGGC CCGCGCGATC 
CTCCAGGTGT TCGACGCCGT GCACCGCGGC GACGCCGACC CCAAGCTGCT CGCGTACCAG 
TACCTGCAGA CGCTGCCGAA GATCGCGTCG AGCCCGTCGA ACAAGATGTG GTTCCTGCCG 
GCCGAGCTCA GCGGTGCGCT GGGGTGGCTC TCCAAGGGCT TCGCCGGCGC GGGCGGCAGC 
GACGGCCAGG ACTACCCGAC ACGTCCCGCG GGGAGCTCGC CGCTCGCCGA GGGCGATCTG 
CCGCCCGTCT CGCTGACCGA CCCGAGCGAG GCGCTGGCGG AGGCGCGGCG CGAGTCGGCG 
GCCGCCACGG CGGACGCCAC GAGCGCGGGC ACACTGTCGG GTGTGCCGTT CGACCCCGCG 
GCCGAGCGGG GGCAGCGCCC GGGTGCCGGG CCTGTCGCAC CGCAGCAGCC CGCGTACGGC 
ACGCCGCCCG CGCGTCCCGC GCAGGCCCCG CAGCAGCCGG CGGCCCCGCA GCAGTCACCC 
CAGCAGGCCC CGCAGCAGCA AGCGCCCCAG GCGCTCCCGC CGCAGGTGCC GCCGCGCCAG 
GGGCCCCCTC CGTCGGTCCC GCCGCAGCGT CCTGAGGAGG GCCAGCCGCC CGCGCGCTGA

Protein sequence

MNDGPGAGQI AAILVLVLVL IFVVVALARA VRIVPQAVAI IVERLGRYNK TLDAGLHLLI 
PFVDRVRANV DLREQVVSFP PQPVITSDNL VVSIDTVIYF QVTSPKDAVY EIANYITGIE 
QLTVTTLRNV IGSMDLEQTL TSRDQINGQL RGVLDEATGK WGIRVNRVEL KAIDPPASVQ 
GSMEQQMRAE RDRRAAILTA EGVKQSAILT AEGEKQSAIL RAEGEAQSAI LRAEGEARAI 
LQVFDAVHRG DADPKLLAYQ YLQTLPKIAS SPSNKMWFLP AELSGALGWL SKGFAGAGGS 
DGQDYPTRPA GSSPLAEGDL PPVSLTDPSE ALAEARRESA AATADATSAG TLSGVPFDPA 
AERGQRPGAG PVAPQQPAYG TPPARPAQAP QQPAAPQQSP QQAPQQQAPQ ALPPQVPPRQ 
GPPPSVPPQR PEEGQPPAR