Gene RoseRS_1396 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_1396
Symbol
ID	5208348
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	1704133
End bp	1705647
Gene Length	1515 bp
Protein Length	504 aa
Translation table	11
GC content	62%
IMG OID	640595007
Product	von Willebrand factor, type A
Protein accession	YP_001275746
Protein GI	148655541
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.000309187
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.000141462
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTATCATC AACCTCGATG GGCGATCATG CCCCTGCTCT GCGGGTTTAT CCTTCTTGCG 
GCGTGCGGCG GCGCTCCGCC GCCTGCAAGC CAGGTGGATG TGCAGGCGAC CATTGATGCT 
GGCGTGCGCG CAACGCTGGC GGCGCAGCCG ACGGAGGCGC CATCACCTAC TACCCCTCCG 
CCATCGCCAA CCGCTGTTCC GCCAACGGCG ACAACCGCGC CCACCAGTCC ACCGGTGGCG 
CCGACGGTCG CGCCCTTTAC GCCCGCCACG CCGACCGCGA CCGGTGCAGA CGCGCCAACA 
ACTGTACCTG AGTCCAGTTC CCCGCCGACT GACACGACCA CCATCTTTCG CCCTGCAGAA 
GGCGAGGCGG CGCAGGTGAC CACCAACATT CAGCTCGTCT TCGACGCGAG CGGTTCGATG 
GCGCAGCGGA TCGGCGGCGA GACCAAAATC CAGGCTGCGC GCCGCGCCAT GGAACGGATC 
ATCGACACGC TGCCCGACAA CCCCGATCTG AACGTCGGCT TCCGGGTGTT CGGGCACGAA 
GGCGACAGCA GCGAAGCGCA AAAAGCGCGT TCATGCCAGA GCACTGCGCT GCTGGTGCCG 
ATGCAGGGAG TCAATAAAGC GTTGCTGCGG CAACAGGCTC AGGCATGGCA ACCGACCGGA 
TGGACGCCGA TCAGTCTGGC GTTGCAGAGA GCAGGGGAGG ATTTCCAGGC GGGAGAGAAT 
GTGCGTAACG TCATCATTAT GGTGACCGAT GGCGAAGAGA CGTGCGGCGG CGACCCGTGC 
GCAGTTGCGA AGGCGCTCGC CGAGTCGCAG GCGGAAGTGC GCATCGACGT GGTTGGGTTC 
GGGACGACGC CGGACGTGGC AAAAACCCTG CGGTGCATTG CCGAGAACAG CGGCGGCGTC 
TATACTGATG CGCAAAATGG TGATGCGCTG GTGCAGACTC TGGAGGAACT GATCGCCGCT 
ACCCTCAAAC GGAGCACTCT GCGCTTCATC CCTGTGAGCA TAAGCGGCGC ACCGGAAGAG 
GTATCGCTGA CCCGCCTGGT CAATGCCCGG GGGGAAGACG TTATGAAAAC CGTCCAGCTG 
CCATGGATGG CGCGATTTGC CCGCGAGCAG GTGGTGGAAC TTCCACCAGG CGAGTATCGT 
TTCACCATCT CCTACAGTGA GATATTCGTC GATCAGACGT CGAAGCATCT TGAGACCACA 
TACACCGCAA TCATCGAAGA GGCGCGCGAA ACCGTGGCGG TCATCGGGCG CGGACAGGTA 
ACCTTTATCA ACGATTCACC CCAATTGCTC CGGCCGGGCG ACGTGCGGGT TGAAAAGGCA 
GTTGATGGGC AGTGGGAAGA GTCCATCAGT CCCGGACAAC TCGTCTCTCT TGGCCCGTAT 
TTTGAGTTTG AACGACCGTT TCGCCTCACG CCGGGACGCT ACCGGGTCTA TGACCGCACA 
CGGGGGAAGG TGTTGATCGA TAACCTGATT GTCGTGCCCG GCAAAGAAAT CACGGTCAGG 
CTCAGTGGCG GGTAG

Protein sequence

MYHQPRWAIM PLLCGFILLA ACGGAPPPAS QVDVQATIDA GVRATLAAQP TEAPSPTTPP 
PSPTAVPPTA TTAPTSPPVA PTVAPFTPAT PTATGADAPT TVPESSSPPT DTTTIFRPAE 
GEAAQVTTNI QLVFDASGSM AQRIGGETKI QAARRAMERI IDTLPDNPDL NVGFRVFGHE 
GDSSEAQKAR SCQSTALLVP MQGVNKALLR QQAQAWQPTG WTPISLALQR AGEDFQAGEN 
VRNVIIMVTD GEETCGGDPC AVAKALAESQ AEVRIDVVGF GTTPDVAKTL RCIAENSGGV 
YTDAQNGDAL VQTLEELIAA TLKRSTLRFI PVSISGAPEE VSLTRLVNAR GEDVMKTVQL 
PWMARFAREQ VVELPPGEYR FTISYSEIFV DQTSKHLETT YTAIIEEARE TVAVIGRGQV 
TFINDSPQLL RPGDVRVEKA VDGQWEESIS PGQLVSLGPY FEFERPFRLT PGRYRVYDRT 
RGKVLIDNLI VVPGKEITVR LSGG