Gene Cfla_0067 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cfla_0067
Symbol
ID	9143932
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cellulomonas flavigena DSM 20109
Kingdom	Bacteria
Replicon accession	NC_014151
Strand	-
Start bp	85007
End bp	86182
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	75%
IMG OID
Product	extracellular repeat protein, HAF family
Protein accession	YP_003635186
Protein GI	296127936
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.899594
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0302964
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCACCA GGACCACACC GAGGCTGCTG CCCGTCAGCC TGCTCGCCTG CACGCTCGCG 
GTGAGTCCCA TCGCAGCAGC GCCCGCCGGC GCCGGCCCGG GGATCACCGT CCAGGACCTC 
GGCACGCTCG GCGGCGTGTC GAGCGGCGCG ACCGACGTCA ACGAGCGCGG CCAGGTGGTC 
GGGACGAGCC TCGTGGCGAA CGGTGACCGG CACGCGTTCC TGTGGGAGCG CGGCGTGATG 
CGTGACCTCG GGACGCTCGA CGGGCTCGAC AGCTACGCGG AGGCGGTCAA CGACCGGGGC 
CAGGTGGTGG GCGGCGCCAC CGACGGCACC GGGGTGCTGC GCCCGTTCCT CTGGGAGCGC 
GGCGTGATGC GTGAGCTCCC CGCCCCCGCG GGTGCGTGGA GCAGCGCCGT CCTGGTCAAC 
CAGCGCGGGC AGGTCGTGAT CTGGGCGGCC CTCGGCGACC AGAGCCACCA CTACCTGTGG 
GACCGCGGAC GGATCACGGA GCTCCGGGTG CCCGGCACCG ACGCGTGGAT CAGCCCGACC 
GACATCAACG ACAAGGGCTG GGTCACCGGC AGCGTCGTGC TCGCCCCGGA CCCCGTCGGC 
CGTGCCGTGC TGTGGCGCGA CGGCGAGGTG GTCCTGCTCG GCTCGCCCGT GCCGCCGGGC 
GACGGGTCGT ACGCCCGGGG CGCGGCGCTG AACGAGGCGG GGCAGGTGGC CGCCACGCTC 
CCGGCGGTGG GCGACTCCGA GGTCGCCGCG CTCTGGCAGG ACGGCGGGTG GACGCTGCTC 
GGGAGCCTCG GCGGCTCGAG CGACGCGCGT GACGTCAACG AGCACGGCAC CGTCGTGGGT 
CGGTCCTTCG TCGACGGCCT CTCCCACGCC GTGCTCCACC GCGACGGGGA GGTCGAGGAC 
CTGGGGGCTC TCGACACGCA GTGGGACGGC TCCGTGGCGC ACCGCCTCAA CGACCGCGAG 
CAGGTGATCG GCACGGTGTG GCCATCCCGG CGGGAGGGAC TGCCGCGGGA CGTGCTGTGG 
CAGGACGGCG AGCTCCACGT GCTGCCCCCG CTCGTCACCG ACGGCGTCAC CCACGCGCTG 
GACATCAACG AGCGTGGCCA GGTCGTCGGC CACGCCGCGA CGGGCGTCCC CGGCGTCGAC 
CACGCCGTGC TCTGGACGAC CCGCCGCGGC TCCTGA

Protein sequence

MPTRTTPRLL PVSLLACTLA VSPIAAAPAG AGPGITVQDL GTLGGVSSGA TDVNERGQVV 
GTSLVANGDR HAFLWERGVM RDLGTLDGLD SYAEAVNDRG QVVGGATDGT GVLRPFLWER 
GVMRELPAPA GAWSSAVLVN QRGQVVIWAA LGDQSHHYLW DRGRITELRV PGTDAWISPT 
DINDKGWVTG SVVLAPDPVG RAVLWRDGEV VLLGSPVPPG DGSYARGAAL NEAGQVAATL 
PAVGDSEVAA LWQDGGWTLL GSLGGSSDAR DVNEHGTVVG RSFVDGLSHA VLHRDGEVED 
LGALDTQWDG SVAHRLNDRE QVIGTVWPSR REGLPRDVLW QDGELHVLPP LVTDGVTHAL 
DINERGQVVG HAATGVPGVD HAVLWTTRRG S