Gene Cagg_0755 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0755
Symbol
ID	7268074
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	935526
End bp	936782
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	56%
IMG OID	643565606
Product	von Willebrand factor type A
Protein accession	YP_002462115
Protein GI	219847682
COG category	[R] General function prediction only
COG ID	[COG2304] Uncharacterized protein containing a von Willebrand factor type A (vWA) domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.802956
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGCAT CAGTCACGTT GCGCTGCCAA TGGGGACGCA CGCCTGTGCC CACAAGTAGC 
ACGCCACAAG TTGTCTATCT GTTGGTGGAA GCGGTTGCTC CTGCTTCACC AACTTCAGCG 
TTGCCACTCA ATCTCTGTTT TGTCCTCGAC CGTTCAGGGT CAATGCAAGG TGCGAAACTT 
GAGAGCATGA AGGCAGCAAC CCGCCGGGTG ATTGAATTAT TGCGTCCGCA CGACGTAGCA 
GCTATCGTCA TCTTTGACGA TACGGTCCAA ACCCTCATAC CGGCGACTCC GGTTGGTGAT 
CGGTCGGCAC TGCTCGCAGC AGTTGAGACC ATTACCGAAG CCGGTGGGAC GGCAATGTCG 
CTCGGGATGC AAGCGGCGCA AACCGAACTC CAAAAACACC TTGGACCTGA TCGGATCAGC 
CGGATGCTGT TGCTGACCGA TGGGCAGACG TGGGGTGATG AGCCAATCTG TCGTGATCTG 
GCCCGCACCC TTGGGCAAGC AGGTGTGCGC ATTACCGCAT TGGGACTAGG CACAGAATGG 
AATGAGCAGT TACTCGACGA TATTGCTGCG GCGAGCGATG GGTATTCCGA TTATATTGCC 
GATCCGGCAC AGATTGAGAC GTTTTTTCAG CAGGCAGTGA AAGAAGCACA GGCTGTCGTT 
GCTACCGATG CACGGCTGCT CCTCCGGCTT GTCCGTGACG TGACGCCGCG TGCCATTTAT 
CGCGTCAAGC CGGTGATTGC GAACCTCGGT TACCAACCCA TCGGCGATGC AGCAGTTGCG 
GTGCGGCTAG GCGATTTAGT CGGTGGGCAA CCGGCAGCCG TCTTACTCGA CCTGATGCTT 
CCTCCACGCA CGCGAGGCCG GTTTCGGATT GCGCAGGCTG AGTTACATTT GACACCGGTT 
GATCAACGGA GTGAAACGGT GATCAAACAA GATATCTTGC TCGATGTCGC CGATCAGGCT 
GGGCCAGAGA GTTATGTTCC CGATGTCATG AATCTAGTCG AGAGGGTAAC GGCGTTTAAG 
TTGCAGACTC GCGCCTTAAG TGAAGCAGCA AGTGGGAATA CGGCGGGTGC AACCCAAAAA 
CTCCGTGCAG CCGCAACTCG CTTGCTCGAT CTAGGTGAAC TAGAGCTTGC CGCGAAGATG 
AATCAACAAG CGGCAACGCT CGAACAGGGT CAACCGCTCG ATCCGGCTAC CCAAAAAGAG 
TTGCGTTATG CTACGCGACG ACTGACCCAG CGACTAGAGA AAAACGAACA GGCATAG

Protein sequence

MSASVTLRCQ WGRTPVPTSS TPQVVYLLVE AVAPASPTSA LPLNLCFVLD RSGSMQGAKL 
ESMKAATRRV IELLRPHDVA AIVIFDDTVQ TLIPATPVGD RSALLAAVET ITEAGGTAMS 
LGMQAAQTEL QKHLGPDRIS RMLLLTDGQT WGDEPICRDL ARTLGQAGVR ITALGLGTEW 
NEQLLDDIAA ASDGYSDYIA DPAQIETFFQ QAVKEAQAVV ATDARLLLRL VRDVTPRAIY 
RVKPVIANLG YQPIGDAAVA VRLGDLVGGQ PAAVLLDLML PPRTRGRFRI AQAELHLTPV 
DQRSETVIKQ DILLDVADQA GPESYVPDVM NLVERVTAFK LQTRALSEAA SGNTAGATQK 
LRAAATRLLD LGELELAAKM NQQAATLEQG QPLDPATQKE LRYATRRLTQ RLEKNEQA