Gene Cfla_3066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cfla_3066
Symbol
ID	9146978
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cellulomonas flavigena DSM 20109
Kingdom	Bacteria
Replicon accession	NC_014151
Strand	+
Start bp	3414710
End bp	3415987
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	74%
IMG OID
Product	von Willebrand factor type A
Protein accession	YP_003638148
Protein GI	296130898
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.000000574906
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGGCCACGT TCCGTGCCGA GGTCTTCCAG AACGAGTTCC TGCCCGACGG CGGGACCGAC 
GTCCACGCGA TCGTCACGGT CACGGCCGAG GGCGTGGGCG GCGCCGCGAC GACGGGCGGC 
GGGGTCGCCG AGATCATCAT GATCGACACG TCGGGCTCGA TGACGGGCCC GATGCTCGCG 
GCGGCCAAGC ACGCCGCGCA GGTCGCGGTC GACACCATCC CCGACGGCAC GTGGTTCGCC 
ATCGTCAGCG GCAGCCACGT CGCGCAGCGC GTGTTCCCGT ACCCGAACGC GCCGGTCGCG 
ATCGTGCAGA TGGAGCCGGG GGCACGCGAG GAGGCCAAGC GGGCCGTCGC GCGGCTGTCC 
GCGCAGGGCG GCACGGCGAT GAGCACGTGG CTGCGCCTCG CCGACCAGAT CTTCGCCACC 
CAGCCGGCCG CGACGCAGCG GCACGCGATC CTGCTGACCG ACGGCAAGAA CGAGTCCGAG 
CCGCGAGCCC AGCTCACGTC GACGATCCAG GCCGTCACCG GACGGTTCCA GTGCGACGCG 
CGCGGCGTCG GCGAACGCTG GCAGGTCGAC GAGCTGCGCG AGATCGCCAC CGCGCTGCTG 
GGCGGCGTCG AGCTCATCGC CGACCCGGCC GACATCGCGA AGGACTTCCA GGCGCTGCTC 
GCGACGTCCC TGTCGCGCGG CGTCGCCGAC GCGCAGCTGC GGGTGTGGAC GCCGCAGGGC 
GGTCAGGTCC TGTTCGTGCG GCAGGTCGCC CCCACGGTCG AGGACCTCAC GGCCCGCCGC 
ACCGAGGTGA CGCCGCTGAT CGGCGCCTAC CCGACGGGCG CGTGGGCCGA CGAGTCGCGC 
GACTACCACG TGGCGGTGCG GGTGCCGTCG AAGACGGTGG GTGCCGAGCA GCTCGCGGCG 
CGCGTGCAGG TCGCGGTCGC CGACGAGGTC GTCGCGTCGG GCCTGGTGAA GGCGGCGTGG 
TCGGACGACG CGTCGCTCAC CGCACGCATC AGCCCCGAGG TCGCGCACTA CACCGGGCAG 
GCCGAGCTCG CGTCGGCCAT CCAGGAGGGC CTGGCGGCCA AGGCCGCGGG CGACGAGGCC 
ACCGCGACCG TCAAGCTGGG CCGCGCGGTG CAGCTCGCCG CCGAGACCGG CAACGAGGAG 
GCGACGTCCA AGCTGCGGCG CGTCGTGGAG ATCGAGGACG AGGAGCACGG CACGGTGCGG 
CTCAAGCGTG GCGCGTCCCG CCTGGACGAG ATGGCCCTGG ACACCGCCTC GACGAAGACC 
TCGCGGGTGC GGCGATGA

Protein sequence

MATFRAEVFQ NEFLPDGGTD VHAIVTVTAE GVGGAATTGG GVAEIIMIDT SGSMTGPMLA 
AAKHAAQVAV DTIPDGTWFA IVSGSHVAQR VFPYPNAPVA IVQMEPGARE EAKRAVARLS 
AQGGTAMSTW LRLADQIFAT QPAATQRHAI LLTDGKNESE PRAQLTSTIQ AVTGRFQCDA 
RGVGERWQVD ELREIATALL GGVELIADPA DIAKDFQALL ATSLSRGVAD AQLRVWTPQG 
GQVLFVRQVA PTVEDLTARR TEVTPLIGAY PTGAWADESR DYHVAVRVPS KTVGAEQLAA 
RVQVAVADEV VASGLVKAAW SDDASLTARI SPEVAHYTGQ AELASAIQEG LAAKAAGDEA 
TATVKLGRAV QLAAETGNEE ATSKLRRVVE IEDEEHGTVR LKRGASRLDE MALDTASTKT 
SRVRR