Gene Rcas_2162 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2162
Symbol
ID	5539642
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	2777336
End bp	2778613
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	62%
IMG OID	640894295
Product	von Willebrand factor type A
Protein accession	YP_001432264
Protein GI	156742135
COG category	[R] General function prediction only
COG ID	[COG2304] Uncharacterized protein containing a von Willebrand factor type A (vWA) domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.314741
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.000328198
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACACCGG GCATTAACCT TCAGCAGACC CTGAGCCGGA CAACGCTGGC GGTCGGTGAC 
GAACCGCAAT TGATCTATGT GCTCCTGGAA GCGCACGCTG AAGGGTTGGC ACAGCAGTTG 
CCCAAATTGC CGCTGAATCT GTGCCTGGTG CTCGATCGCA GTTCTTCGAT GCGCGGGGAG 
CGCCTGATGC AGGTCAAGGA CGCCGCAGCA CGCATCGTCG ATCAATTGGG GCAGGACGAT 
TATTTTTCGC TGGTGGTGTT CAACGACCGG GCTGATGTGG TTATTCCGGC GCAGCGCGCG 
ATCAAGAAGG CGGACCTGAA AGCGGCGATT GCGCAGATTG AGGCGGCCGG CGGCACGGAA 
ATGGCGCAGG GGATGGCGCT GGCGCTCCAG GAGGTGCAAC GACCGTTTCT GACACGCGGC 
ATTAGCCGGA TCATTCTGTT GACCGATGGC CGCACCTACG GCGACGAGAG CCGGTGTGTC 
GAGATCGCTC GCCGCGGGCA GTCGCGCGGC ATTGGGTTGA CGGCGCTCGG AATTGGAACG 
GAATGGAACG AGGACCTGCT CGAAACGATG ACCGCCAGCG AAAACAGTCG TGCTCAGTAC 
ATCGCCACTG CCCAGGATGT CGTCAAGGTC TTCGCCGATG AGGTGAAGCG CCTCCATGCC 
ATCTTCGCCC AACAGGTGCA ACTGTCGGTC GAGACACGCC CCGGCGCGTT GTTGCGGTCG 
CTCGATCAGG TGCGCCCTTT CATTGCGCCG ATTACCATTA TCGAAGAAGC AGAGCGCCGC 
TGGGTGGCCA ATCTGGGAGA CTGGCCCGAT ACCGGCGTGC AGGGATTTCT GCTCGAAGTC 
GTTGTGCCTC CCTTACCGGT TGGTGATCAC GCGGTGCTGA AACTGACGTT GCGCTATCAT 
CTGCCTGGGG CAAACCTGCG CGATCAGGCG CGTGAACTCA TGGTTCGCGT TAGCCTGCGC 
CCGGCGGAAG AGGTCACCCA TCGCGTCGAT GCAACCCTCA AACACTGGCT GGAGCGCCTG 
GTGGCGTATC GCCTGCAAGC AAACGCCTGG AAGTGCGCGG CGGAAGGACG ACTCGAGGAA 
GCGAGCGAGC GTCTGCAAAT GGCAGGAACG CGCATGCTCA ACGCTGGCGA CGCGGCGCTG 
GCGCATACGT TGCAACAGGA AGCGACGCGC ATTCTGCGCA ACGGAACGGT GAGCGAAGAG 
GGACGCAAGC GCATCCGCTT TGGCACTCGC GGTCTGATCG GTCCGGTTGC CGACGATGAA 
CGCGAGACTA CGACGTGA

Protein sequence

MTPGINLQQT LSRTTLAVGD EPQLIYVLLE AHAEGLAQQL PKLPLNLCLV LDRSSSMRGE 
RLMQVKDAAA RIVDQLGQDD YFSLVVFNDR ADVVIPAQRA IKKADLKAAI AQIEAAGGTE 
MAQGMALALQ EVQRPFLTRG ISRIILLTDG RTYGDESRCV EIARRGQSRG IGLTALGIGT 
EWNEDLLETM TASENSRAQY IATAQDVVKV FADEVKRLHA IFAQQVQLSV ETRPGALLRS 
LDQVRPFIAP ITIIEEAERR WVANLGDWPD TGVQGFLLEV VVPPLPVGDH AVLKLTLRYH 
LPGANLRDQA RELMVRVSLR PAEEVTHRVD ATLKHWLERL VAYRLQANAW KCAAEGRLEE 
ASERLQMAGT RMLNAGDAAL AHTLQQEATR ILRNGTVSEE GRKRIRFGTR GLIGPVADDE 
RETTT