Gene Cagg_3732 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3732
Symbol
ID	7267805
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	4545926
End bp	4547182
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	56%
IMG OID	643568539
Product	von Willebrand factor type A
Protein accession	YP_002465004
Protein GI	219850571
COG category	[R] General function prediction only
COG ID	[COG2304] Uncharacterized protein containing a von Willebrand factor type A (vWA) domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.285175
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.068193
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAAGG TTGAACTGCG GATAACGCCT AGTCGCAGTG TGTTACCGGC CCTTAACGAG 
CCACAGCTCT TGTATGCGCT GATCGAGTTG TCGGCACAGA GCGGTGCAAC GAAGATGCCC 
CGTCTGCCGC TGAACTTGTG TTTGGTGATC GACCGCAGCT CGTCGATGCG TGGTGAGCGT 
TTGCAACAGG TGAAGCAGGC CGCGATGCAG ATTCTCGACC TGCTTGGTGA TAACGAGAGT 
TTTGCATTAG TCACGTTCAA TGACCGGGCC GAAGTGGTGG TATCGTCCCA ACTGGCACGG 
GCACGGGCTG AAATTAAACG CCAAATTAGC GCAATCGAAG CTGCCGGCGG TACCGAAATG 
GCAACCGGTT TGGCGCTTGG TGTGCAAGAA CTGCAACGGG CGATGATGCC GCGGGCGATC 
CATCGCTTAC TGTTGCTGAC CGATGGCCGT ACTTACGGTG ATGAGAGCCG TTGTGTCGAG 
ATTGCGCGGC GTGCCCAAGC GCGTGGGATT GGGATTACGG CGTTAGGCAT CGGTAGTGAG 
TGGAATGAAG ACTTGCTGGA AACGATCGCC GCGCGAGAGA ATAGTCGCAC GCACTATATT 
ACGTCTGCCG CCGACATCAC CAAGATTTTT ACCGCCGAAG TTGAGCGTAT GCACAGTATT 
TTCGCCCAAG ATGTGCAGGT GCGACTAGCC TTACCGCCGC AGGCCCTCGT CCGTTCGTTC 
GACCGGGTAC GTCCTTTCAT CGGGCCATTA CCGGTGATGG AAGAGGCTGA TTCGGTCTGG 
ACGGCCACAC TCGGTGATTG GCCTGAGCAG GACGTACAAG CTTTTTTGGT TGAAGTGGTG 
ATACCGTCGT TGCCCGAAGG TCGTCATACG CTGATCCGAT TCAATCTGCG TTTTCGCATA 
CCCGGAAGTG ATAATGCGGT GCAGAGCTAT GACCAGGTGT TGCAGGCTGT AGTTCGCGAT 
CCGGCTGAGG TAAATGCTGA TGTTGATCCG ACGGTCAAGC ATTGGCTGGA ACGGTTGGTC 
GCCTATCGGT TGCAGGCCAG TGCATGGCAA GCGGTTGAGG AAGGAAAACT AGAAGAGGCA 
ACTCGGCGGT TACAAATGGC CGGTACGCGC CTATTTGAAG CGGGTCAGGT TGAACTGGCG 
CGTGCCGTTC AAGAGGAAGC AACTCGCCTG CTCCGCTCCG GTCAAGCGAG TGCCGAGGGT 
CGCAAACGGA TCAAGTATGG TACGCGCGGC TTGATCGGGC GTGAAGAGCA GTCATAA

Protein sequence

MSKVELRITP SRSVLPALNE PQLLYALIEL SAQSGATKMP RLPLNLCLVI DRSSSMRGER 
LQQVKQAAMQ ILDLLGDNES FALVTFNDRA EVVVSSQLAR ARAEIKRQIS AIEAAGGTEM 
ATGLALGVQE LQRAMMPRAI HRLLLLTDGR TYGDESRCVE IARRAQARGI GITALGIGSE 
WNEDLLETIA ARENSRTHYI TSAADITKIF TAEVERMHSI FAQDVQVRLA LPPQALVRSF 
DRVRPFIGPL PVMEEADSVW TATLGDWPEQ DVQAFLVEVV IPSLPEGRHT LIRFNLRFRI 
PGSDNAVQSY DQVLQAVVRD PAEVNADVDP TVKHWLERLV AYRLQASAWQ AVEEGKLEEA 
TRRLQMAGTR LFEAGQVELA RAVQEEATRL LRSGQASAEG RKRIKYGTRG LIGREEQS