Gene Rcas_2577 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2577
Symbol
ID	5540059
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	3326375
End bp	3328063
Gene Length	1689 bp
Protein Length	562 aa
Translation table	11
GC content	59%
IMG OID	640894706
Product	von Willebrand factor type A
Protein accession	YP_001432673
Protein GI	156742544
COG category	[R] General function prediction only
COG ID	[COG2304] Uncharacterized protein containing a von Willebrand factor type A (vWA) domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGACATC CTTTCCGATG GCTTCTGATC CTGGTTCTGT TGACGCCGCT GCTAGCAGCG 
TGCGGCGCCG GCGGTGGCGA CGGAGGGTTC CTGGGAGGCA ATACCGTCGA AGTCAGCATT 
GCCTACGGCA GCGAAAAGCG TGCATGGCTC GAAGAGGCGG TTCGACAATT CAACGCTGCC 
GGGCGGAAAA CGGCGAGCGG AGCATCCATT CAAGTGGTGG CGACGCCAAT GGGTTCAACC 
GACTCGATGA ACCAGATTCT GAGCGGCGCC ATTCAGCCGA CCGTCTGGAG TCCGGCGAGC 
AGGATTCTGC TGCCGGTCGC CAACGATGAA TGGGGCAAAC GCAACAATGG CGCAACGCTC 
GTCGATGAAA ATGCGCCGCT CCTGGTGCTC AGCCCGGTTG TCATTGCCAT GTGGAAGCCG 
ATGGCGGAAG CGCTCGGCTG GCCCAACAAA CCGCTCGGCT GGTCCGACAT CGCCGAACTG 
TCGGCAAGCG GCAAAACCTG GGCGGACTTC GGCAGACCGG AGTGGGGTCC GTTGCAGTTC 
GGTCACACCC ATCCTGATTA TTCGAACAGC GGGGTAGCGA CGATTATTGC GATCAGTTAT 
GCCGCCGCCG AAAAAACCCG TGGCTTGACC GTCGCCGATG TGCAGAATCC AAAAACGGCG 
GAGTTCATGC GGAATATCGA GAGCGGCGTC ATTCACTACG GCGAAAGCAC CGGCTTTTTC 
GCCGACCAGA TGTTCAACCG GGGACCGGGA TACCTCTCGG CGGCGGTGCT GTACGAAAAT 
CTGGTGATCG AAGCCTACAA TCGTGATCGC TATCCCTCCG TCTCTCTCCC GGTCGTTGCC 
ATTTATCCGA AGGAAGGCAC GTTCTGGACT GACCATCCCT ACGCGATCCT GAACGCGCCG 
TGGGTGACTG ATGAGCAACG CGAGGCGGCG AATATCTTTC TCCGCTATCT GCTCGACCGT 
CCGCAGCAGG AATTGGCGTT GCGCTACGGC TACCGGCCCA GCAACACCGA TGTAGCAGTC 
GGCGCGCCGA TTACGCCGGA GAACGGCGTC GATCCACAGC AACCACAGAC GCTTCTCGAA 
GTGCCGCGCC CGGATGTATT GAGCGCTATT CGTAGCATCT GGGAGCAGAA CAAAAAGCGG 
GTCGACGTGA TGGCAGTGCT CGATGTTTCT GGCAGTATGG AGGACGAAGG GCGTTTGGAG 
CAGGCAAAAG CGGCGCTGCG CATCTTCGTC GAGCAGTTGC AGGACGATGA TGGTTTCGGG 
TTGACGATCT TCAGCGACCA GGCGACTGTG CTGACGCCGA TCTCGCCCAT CGGTTCCAGG 
CGCACCGAGG TTCTCAACCG CATCGCCGGG TTGACGCCGC GTGGCGGGAC GCGCCTGCTC 
GATACGGTGG TTGAGGCGTA TCAGGAATTG ACCGCAACAC CGCCCGGTCA GCGCATTCGC 
GCGGTTGTGG TGCTGACCGA CGGGCTGGAC AATAGAAGCC AGCGTTCAGC GGAAGACGTG 
CTCGATCTGC TCAGGCAGGA TAGAGAAGGG TACAGCATCA AAGTGTTCAC CATTGCGTTC 
GGTGGTGATG CTGATGTACA CTTGCTGAAG GAGATTGCCA GTGCTACCGG GGCGAAGAGT 
TACGTTGGCA AACCTGGCGA GCGTGGCGCA ATTGAGCGTA TCTATCAGGA TATTACGACA 
TTCTTTTGA

Protein sequence

MRHPFRWLLI LVLLTPLLAA CGAGGGDGGF LGGNTVEVSI AYGSEKRAWL EEAVRQFNAA 
GRKTASGASI QVVATPMGST DSMNQILSGA IQPTVWSPAS RILLPVANDE WGKRNNGATL 
VDENAPLLVL SPVVIAMWKP MAEALGWPNK PLGWSDIAEL SASGKTWADF GRPEWGPLQF 
GHTHPDYSNS GVATIIAISY AAAEKTRGLT VADVQNPKTA EFMRNIESGV IHYGESTGFF 
ADQMFNRGPG YLSAAVLYEN LVIEAYNRDR YPSVSLPVVA IYPKEGTFWT DHPYAILNAP 
WVTDEQREAA NIFLRYLLDR PQQELALRYG YRPSNTDVAV GAPITPENGV DPQQPQTLLE 
VPRPDVLSAI RSIWEQNKKR VDVMAVLDVS GSMEDEGRLE QAKAALRIFV EQLQDDDGFG 
LTIFSDQATV LTPISPIGSR RTEVLNRIAG LTPRGGTRLL DTVVEAYQEL TATPPGQRIR 
AVVVLTDGLD NRSQRSAEDV LDLLRQDREG YSIKVFTIAF GGDADVHLLK EIASATGAKS 
YVGKPGERGA IERIYQDITT FF