Gene Rcas_1710 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1710
Symbol
ID	5539188
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	2206110
End bp	2208206
Gene Length	2097 bp
Protein Length	698 aa
Translation table	11
GC content	61%
IMG OID	640893849
Product	von Willebrand factor type A
Protein accession	YP_001431820
Protein GI	156741691
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.425591
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATCG TGACCGAACG CCTTGTGTTT CCGATCCGAA TGCCGGCAGT GCGGATGCTG 
TGGGTTGCAA TGCTCATTGC AATCTTGCTC CTGCCGACAT CTCCGGCGAC GGCGCAGCAG 
ACCGGGCAGG CGCTCGATTC AGGAAATAGC GACGTGGTCC TGATTATCGA CAACTCCGGC 
AGCATGAAGC AAAACGATCC GCAGAACCTG CGTCTCGCCG CAGCCAATCT CTTTATCGAT 
CTATCGGACC CGCGCGACAA AATCGGCATT GTTGTTCTTT CCGACCGTAT GCGCACGCGT 
TCGCTGACGA AGAATCTTGT CCGTATCGGC AGCCGGCAGG ACATCGATGA GTTGAAGGGA 
CTGGTCGATG CGCTGCGCAA CGAGACAAAA GGGCAGGAGA CGCATATGGG AACGGCGCTC 
GATCTGGCGT ATGACCTGCT CGACGCAACG CCGGGATCGA ACCGGGGCGC CAACCAGCGT 
CAGTTTGTCG TGCTCCTCAG CGACGGATTG CCAACGGGCG TCGGGCAACG CGAGCGCGTC 
GATCAAGCCG TACAGCGCTT CCGTGAGCGA CGGTACTGGA AGATATTCTC CATTGCGCTG 
GGCGATGAAG CGGATCCGGC GTATCTCGAC GAGAAGGTGT CCTCTCCCTC CGGCGGGCAG 
GTGGTCGTCG CCCGCCATGC CGGTGAACTG CTCGACCGGT ACCTTGACGT GTATGCGCGC 
GCCGGTGATG ACCGGTACAT CAATTATGTC ACAGTGCAGC CGAACACGCT GGCGCCGCTG 
GTTGACGTGC GGCTGGATCA CCAGCCGACG CAGATCGGCG TCGTGCTGGT GCGTGGCGAC 
AGCAATGCCA GCATTAGCAG TCTATTGGCG CCAGACGGGG CGGATCTGGT GCAACCCTAC 
TACCAGAATA GCGTGCGGCG CGGGGCTGAA CCGGAATACG AACTGTATAC GGCAATGTCA 
ACCGACCAGG TATCGCTCGT TGGGCGCTGG ATGATCAATG TTGATCGTCC TGATGCGTTG 
CCAACCACAA TTGCCGTGCT GAGTCGCTCG CGGCTACGCA TACGGATGCC AGCGCCGGCG 
CCGCTGCGTG ACAACGAGGA TACCAGCCTG CGCTACCATC CGGTCGGACG ACCGCTACTG 
TTGGTGGTTG GGGCGCAGGT TGCCGAACGA AATTACGATC AGCATGTTAC TACTCCCTAC 
CTGTACCGCT GGGTGGCAGA CATGGCGCCG GCAGCGCACA TGCTCACGCC GTTCGAGGGT 
CCACCCATTG TGCTGGTAGA CGATGGACGC GCCTGTGATC AGCGCGCAAA CGATGGACGT 
TACAGCGGCG TACTGCCGCC TTTCCCCACT GAAGGGGATT ATACGTTGCG TCTGGAATTC 
CCTGGGGCGC ACCCGAACCC TATCCATGTG CAGAAAGACT ACATCGTGCG CGTGGCTGCG 
TTGCCGACCA TGACGATAAC GCTGCCGCCG GCTGCGACAA CCCTGCCGAT CAATACGCCA 
TTGACCGCCT GGATCGATCT GCCCGGAAGG GCAGACTTCG AGATTGTGAA TGTGATGTTC 
CCAACAGCGT TTGTGCAGCG TCCCGACGGG GTGCTCGAAA CGCTGGAGAT TGAGTCGGTG 
GACCGCGGAC GTTTCCGTTT CCGCTACACA CCCGGCTTCG AGGGACAGTA CCGCATCAAT 
ATTGCGGCAG AGGTGCATGG GCGAGGTGCA ATGGGGGACA TCCGGTACAT CGACTATGCC 
GACGCCCTGA TCGGCGTACC GAAGGCGACG CCGATCGTTG AGATCAGCGC TGCCTTCACC 
GGCACGCTGG TCTACGACCG GCGAGGCATT TTGAGCGTTC CTCTCAAGAT TGCATCACGC 
TCTCCACAGG AAGAGCGCCT GGTGATCACA GTGACCAACC CGGCAGGCGC GATCACGGTG 
CCGGCAGAGG TGCTTTTGCA GCCAAACGAG TCCATACAGC GCACAATCAG CGTGCGACTG 
CCGGAGAAGG ATCGTCCCGC GCGCGGCGCC CTGATGCTCC AGTTGACGGC GCCAGAGCAG 
CGCGTGATTG TTCAGGGTGA GACCATCAGC GTCGCTATCG TGCGCCTGCC GGTCTGA

Protein sequence

MTIVTERLVF PIRMPAVRML WVAMLIAILL LPTSPATAQQ TGQALDSGNS DVVLIIDNSG 
SMKQNDPQNL RLAAANLFID LSDPRDKIGI VVLSDRMRTR SLTKNLVRIG SRQDIDELKG 
LVDALRNETK GQETHMGTAL DLAYDLLDAT PGSNRGANQR QFVVLLSDGL PTGVGQRERV 
DQAVQRFRER RYWKIFSIAL GDEADPAYLD EKVSSPSGGQ VVVARHAGEL LDRYLDVYAR 
AGDDRYINYV TVQPNTLAPL VDVRLDHQPT QIGVVLVRGD SNASISSLLA PDGADLVQPY 
YQNSVRRGAE PEYELYTAMS TDQVSLVGRW MINVDRPDAL PTTIAVLSRS RLRIRMPAPA 
PLRDNEDTSL RYHPVGRPLL LVVGAQVAER NYDQHVTTPY LYRWVADMAP AAHMLTPFEG 
PPIVLVDDGR ACDQRANDGR YSGVLPPFPT EGDYTLRLEF PGAHPNPIHV QKDYIVRVAA 
LPTMTITLPP AATTLPINTP LTAWIDLPGR ADFEIVNVMF PTAFVQRPDG VLETLEIESV 
DRGRFRFRYT PGFEGQYRIN IAAEVHGRGA MGDIRYIDYA DALIGVPKAT PIVEISAAFT 
GTLVYDRRGI LSVPLKIASR SPQEERLVIT VTNPAGAITV PAEVLLQPNE SIQRTISVRL 
PEKDRPARGA LMLQLTAPEQ RVIVQGETIS VAIVRLPV