Gene Cfla_1824 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cfla_1824
Symbol
ID	9145717
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cellulomonas flavigena DSM 20109
Kingdom	Bacteria
Replicon accession	NC_014151
Strand	+
Start bp	2035278
End bp	2036507
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	67%
IMG OID
Product	Type II secretion system F domain protein
Protein accession	YP_003636920
Protein GI	296129670
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.608306
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.597079
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGCCG GGACGAAGAC CTTCGAGTAC GCGGTCCGTG ACCGGTCGGG GAAGATCGTC 
AAGGGCCGCG TCGAGGCGAA CAACCAGGCC GCCGTCGCCA ACCGGCTGCG CGAGATGGGC 
CTTGCGGCCG TCTCGATCTC GGAGGTCTCC ACGAGCGGCC TGCAGACCGA GTTCACGATC 
CCCGGGCTGT CCAACAGGAT CTCCCTGAAG GACATCGCCA TCATGTCGCG CCAGCTGGCG 
ACCATGATCG ACTCCGGCCT GTCCCTGCTG CGCGCGCTGG CGATCCTCGT CGAGCAGACC 
GAGTCCAAGC CGCTCGCGAA GATCCTGTCG CAGGTCCGCA ACGACGTCGA GGTCGGGACC 
GCGTTCTCGA CGGCGCTGGG CAAGCACCCG GAGACGTTCC CGCCGCTGAT GGTCAACATG 
GTGCGCGCCG GCGAGGTCGG CGGCTTCCTC GACCAGACGC TCGTGTCCAT CGCCGACAAC 
TTCGAGACCG AGGTCCGGCT GCGGGCCAAG ATCAAGTCCG CGATGGCCTA CCCCGTCATC 
GTCCTGGTGA TCGCCGTCCT GGCCGTGGTG GGCATGCTGC TGTTCATCGT GCCGGTCTTC 
GCCGAGATGT TCGCCGGGCT CGGCGGCGAG CTGCCGGGGC CGACCAAGTT CCTCATGTTC 
CTGTCGGGCA TGCTGAAGTG GACGATCGGT CCCACGGTCG TCCTGCTGGT GCTGGCGGGC 
GTGTGGTGGG GCAAGCACAA GAACGACAGG GCCCTGCGCG AGCGGATCGA CCCGCTGAAG 
CTCAAGGTGC CGGTCTTCGG GCCGCTGTTC CGCAAGATCG CGGTGTCCCG GTTCACGCGC 
AACTTCGGGA CGATGATCCA CGCGGGCGTC CCGCTGCTCC AGGCCCTGGA GATCGTCGGC 
GAGGCCAGCG GGAACATCGT CATCGAACGC GCGGCCAAGG CCGTGCAGGA GTCCGTGCGG 
CGCGGTGAGT CGCTGGCGGG GCCGCTGTCG CAGCACCCGG TCTTCCCGCC GATGGTCGTG 
CAGATGATGG CGGTCGGTGA GGACACCGGC GCGCTGGACA CCATGCTCGG GAAGGTCGCC 
GACTTCTACG ACCAGGAGGT CGAGGCGATG ACCGAGCAGC TCACGAGCCT CATCGAGCCG 
CTCATGATCG TCGTCATCGG CGCGATCGTC GGCTTCATGG TGATCTCCAT GTACATGCCG 
ATCTTCGGCG TCTTCGACCT CATCCAGTAG

Protein sequence

MAAGTKTFEY AVRDRSGKIV KGRVEANNQA AVANRLREMG LAAVSISEVS TSGLQTEFTI 
PGLSNRISLK DIAIMSRQLA TMIDSGLSLL RALAILVEQT ESKPLAKILS QVRNDVEVGT 
AFSTALGKHP ETFPPLMVNM VRAGEVGGFL DQTLVSIADN FETEVRLRAK IKSAMAYPVI 
VLVIAVLAVV GMLLFIVPVF AEMFAGLGGE LPGPTKFLMF LSGMLKWTIG PTVVLLVLAG 
VWWGKHKNDR ALRERIDPLK LKVPVFGPLF RKIAVSRFTR NFGTMIHAGV PLLQALEIVG 
EASGNIVIER AAKAVQESVR RGESLAGPLS QHPVFPPMVV QMMAVGEDTG ALDTMLGKVA 
DFYDQEVEAM TEQLTSLIEP LMIVVIGAIV GFMVISMYMP IFGVFDLIQ