Gene Cfla_2200 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cfla_2200
Symbol
ID	9146100
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cellulomonas flavigena DSM 20109
Kingdom	Bacteria
Replicon accession	NC_014151
Strand	-
Start bp	2455252
End bp	2457009
Gene Length	1758 bp
Protein Length	585 aa
Translation table	11
GC content	79%
IMG OID
Product	FHA domain containing protein
Protein accession	YP_003637290
Protein GI	296130040
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.632754
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.00361499
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGAGCGACC GCACGCACCA CGAGTACCAG GACGGACCCT GGACGGCCGT CGTGTCCGAC 
GGGTTCCTCG CGCTGGTCGA GCCGGACGCG CCGTGGCGCC TCGTCGACGG CCTGTGGCGG 
GTGGCCAGCG AGGGCGGCGA CGTGCTGGGC GCCCTCGGCG TGGTCGCGGC CGACGGGTTC 
GCTGCCCTGC CCGGGTTCGC GGTGCTGCGC GCCGACGGCG ACGGTGCCGT GCACGCGGTG 
CTGCGTGGTG CGGTGCGGCT CCGCCTGCAC GGCGTGGACG GCACCCAGGA GGTCACGGCC 
GGTGACGGGG CCGTGTGGAC CGAGCACCGT GCGTTGGGCG TGCTCGGCCT CGAGCTCGCT 
GTCGACGCGG TGCCCGACGC GACCTGGTGG CCGCTGACCG GCGGTGTCGT GCGGTCCGGC 
GGTCTGCGGA CCGGTGAGGT GCCGGACGCC GCCACGGTGG TGCCCGTGGC GCTGCCGGAC 
ACCGCGACGC ACGAGCAGCC GATCGTGCCG GAGCCCGCCG GCGACGCGGT GCCGGAGCAC 
CCCGTGGTGG TCGACGTCGC CGCGGTGCCG GGCGGCTCGG TGCCGGGCGG CGCGGTCGCC 
GCGGCGGAGC CGCCGCGGCC GTCCGGGGCG GAGATCGAGC CGTCGGCGGA GACCGAGTCG 
GCGGAGGAGA GCGAGCCGGC GGAGGAGAGC GAGCCGGCGG CGGAGACCGA GTCGTCGGCG 
GAGACGGGGC CGTCGGGGGA GACCGAGCCG CCCGCAGGGT CCGAGCCGGA GGCGGCGCCC 
GAGCCTGCGG GCCCCACCGT GGCCGCGCCG GTCGAGGCCG CCGTCCCCGC CGATCCCGCG 
GGCGTGGTCG AGCCCGACGT GGCGACGCTG CCGGCACCCG AGCTCGGCCT GCCCGAGCCG 
CTCGAGCCGG CGCCCGCCGC GCCGGTCGAG CAGGTGGAGG TCGACCCGTG GGCGCCCGCG 
CCGGTCGCAG CCGCGCTGCC GGCGGCACCC GTCGAGCCCG ACGTGCCCAC CGAGCGGCTC 
TCGCCCGAGG AGCTGCTCGA GGCGGCCGGC CCGCCCGCAT GGTCCGGCGC GGAGGCGGTG 
GCGTGGTCGG CGGCGGGGCC CGCGGACACG CCGGCGCCGG CACCGGAACT GGCACCAGCC 
CCGGAGCGCG AGCCCGAGAT CCCCTGGTGG CCGCTGGGCG ACGCGGGGAC CGCCGAGCCC 
GCGCCGACCC CCGCCGCGCC CGCGTCCACG CCCGCCCCGC CCCCGTTCGC GCCGGTGACC 
GCCCCCGCGG CGGTCGCCGA CGAGACGGCG GGGTCCGACG ACCACGACGG CATGACGATC 
CTGTCCTCCG ACCTCGCGCG GCTGCGCGAC CGTCTCCCGG CCTGGTCGCA GGACGCCGAG 
CCCGGGCCGT TCCCCGTGCC GCAGCCCGCG CCGCTGGCCG CGCGCATGGT GCTCTCGACG 
GGACTCGTGG TCGCGCTCGA CCGCGCCGTC CTGCTGGGAC GCGCGCCGCA GGTCGCGCGC 
GTGTCCAACC GTGAGCTGCC GCGCCTGGTG ACGGTGCCGA GCCCCAACCA GGACATCTCG 
CGGACGCACG CCGAGGTGCG CGTCGAGGGC GACCACGTCA TCGTCACCGA CCTCGACTCC 
ACCAACGGGG TGCACGTGTC GCGGCCCGGC GAGGGCGTGC GGCGGCTGCA CCCCGGCGAA 
CCGAGCGTCG TGGGGCCCGA CGAGGTCGTC GACCTGGGCG ACGGCGTCAC GTTCACCGTG 
GAGCGCAGCG CGTCGTGA

Protein sequence

MSDRTHHEYQ DGPWTAVVSD GFLALVEPDA PWRLVDGLWR VASEGGDVLG ALGVVAADGF 
AALPGFAVLR ADGDGAVHAV LRGAVRLRLH GVDGTQEVTA GDGAVWTEHR ALGVLGLELA 
VDAVPDATWW PLTGGVVRSG GLRTGEVPDA ATVVPVALPD TATHEQPIVP EPAGDAVPEH 
PVVVDVAAVP GGSVPGGAVA AAEPPRPSGA EIEPSAETES AEESEPAEES EPAAETESSA 
ETGPSGETEP PAGSEPEAAP EPAGPTVAAP VEAAVPADPA GVVEPDVATL PAPELGLPEP 
LEPAPAAPVE QVEVDPWAPA PVAAALPAAP VEPDVPTERL SPEELLEAAG PPAWSGAEAV 
AWSAAGPADT PAPAPELAPA PEREPEIPWW PLGDAGTAEP APTPAAPAST PAPPPFAPVT 
APAAVADETA GSDDHDGMTI LSSDLARLRD RLPAWSQDAE PGPFPVPQPA PLAARMVLST 
GLVVALDRAV LLGRAPQVAR VSNRELPRLV TVPSPNQDIS RTHAEVRVEG DHVIVTDLDS 
TNGVHVSRPG EGVRRLHPGE PSVVGPDEVV DLGDGVTFTV ERSAS