Gene RoseRS_1843 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_1843
Symbol
ID	5208803
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	-
Start bp	2276963
End bp	2278225
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	60%
IMG OID	640595451
Product	von Willebrand factor, type A
Protein accession	YP_001276182
Protein GI	148655977
COG category	[R] General function prediction only
COG ID	[COG2304] Uncharacterized protein containing a von Willebrand factor type A (vWA) domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.122736
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGGCG AGGTCACAAT TCGCGCGTCG CTGGCGCGCC CATACATGGC AGCAGCGGCG 
ACGCCGCAGG TTGCCTATAT GCTGATCGAA ATCACGCCTG GTCAGGTGAT GACGCAGGTG 
CGTGCACCGG TCAATGTCTG TTTCGTGATT GACCGGAGCG GCTCGATGAA GGGCGAGAAG 
ATCGACCGGG TGCGACGGGC GACGATCCGC GCCATTGAGA TGCTCGATGC GCAGGATGTC 
GTCTCGGTGG TCATCTTCGA TCATCGAACC GAGGTGCTGA TCCCTGCCAC GCCGGTGACC 
AGACCTGCCG AACTGATCGA CCGTATCAAT CGTGTGCGCG ACAGTGGCGG CACCCGGATC 
GCACCGGCCA TCGAAGCGGG ATTGCGCGAG ATCGAGAAGG GACCGCCACA GATGGTGCGG 
CGGCTCATTT TGCTCACCGA CGGTCAGACC GAGAACGAGT CCGACTGCCT GCGCCGTGCT 
ACGGATGCCG GGCAACGCAA TGTGCCGATC ACGGCACTCG GTGTGGGCAA GGATTGGAAC 
GAAGACCTGC TGATCGAAAT GGCGAACCGT TCAGGCGGAA CTGCCGATTA CATTGATCGT 
CCGGAAAAGA TCGTCGAGTA CTTCCAGAGC ACCATCCAGC GCGCCCAGGC GACTGCGGTG 
CAGAATGCAA ACCTGACGCT GCGACTGGTG CAGGGAGTGC TGCCACGCGC AGTATGGCAG 
GTCTACCCGC TGATCAACAA TCTCGGCTAC CGCCCGATCT CCGACCGTGA TGTCAGCGTG 
CCGCTCGGTG AACTGGAAAC CGGCAGCGGT CGCACCCTGC TGATCGAAGT GCTGGTCGAG 
CCGCGCCCGG CAGGTGAATA TCGCATCGGG CAGGCGGAAG TGAGTTACGA CATTCCGCTG 
CTGAACCTGC GCGATGAAAA GACCCGCGCC GACATCATGC TCACGTTTAC GACCGACGCT 
GCGCTTGCGA GTCAGGTAAA TGCCAGCGTC ATGAACATTG TTGAAAAGGT CAGCGCCTTC 
AAACTGCAAA CGCGAGCGCT GCAAGACCTG GCGGCCGGCG ATGTCACCAG CGCGACGCAA 
AAATTGCAGA GCGCCGTGAC CCGTCTGCTC AACCAGGGCG AAGTCGAACT GGCGCAGACG 
ATGCAGCGCG AAATCCAGCA CCTGCAACAG ACAGGCAAAC TCTCCAGCGA AGGACAGAAG 
ACGATCAAGT TTGGAGTACA GAAAACCGTT CGCCTGAGCG ACATCAAGAA AGATGAACCC 
TGA

Protein sequence

MAGEVTIRAS LARPYMAAAA TPQVAYMLIE ITPGQVMTQV RAPVNVCFVI DRSGSMKGEK 
IDRVRRATIR AIEMLDAQDV VSVVIFDHRT EVLIPATPVT RPAELIDRIN RVRDSGGTRI 
APAIEAGLRE IEKGPPQMVR RLILLTDGQT ENESDCLRRA TDAGQRNVPI TALGVGKDWN 
EDLLIEMANR SGGTADYIDR PEKIVEYFQS TIQRAQATAV QNANLTLRLV QGVLPRAVWQ 
VYPLINNLGY RPISDRDVSV PLGELETGSG RTLLIEVLVE PRPAGEYRIG QAEVSYDIPL 
LNLRDEKTRA DIMLTFTTDA ALASQVNASV MNIVEKVSAF KLQTRALQDL AAGDVTSATQ 
KLQSAVTRLL NQGEVELAQT MQREIQHLQQ TGKLSSEGQK TIKFGVQKTV RLSDIKKDEP