Gene Shewmr4_2973 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr4_2973
Symbol
ID	4253544
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-4
Kingdom	Bacteria
Replicon accession	NC_008321
Strand	-
Start bp	3550455
End bp	3552329
Gene Length	1875 bp
Protein Length	624 aa
Translation table	11
GC content	48%
IMG OID	638119609
Product	von Willebrand factor, type A
Protein accession	YP_735101
Protein GI	113971308
COG category	[R] General function prediction only
COG ID	[COG2304] Uncharacterized protein containing a von Willebrand factor type A (vWA) domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.00160061
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGATATC CATCTTCAGT CTTTCGCCGT AAAACGCTCT CAAGCATTGT CGTTTCGGGA 
TTAACACTCG CTATTTTGCT CGGCTTGAAT GGTTGCAGTG ATAAATCCGA CGACCAGCAA 
AAGCGTGCTG AATTAGCCGA TCAAACAAAA CTCGCCGCCG AGCAACAGGC TGAGCTTAAG 
CAGCAAGTAG AGTTAAAGGA CAGTGTTGAG CGTCAGGCCA ATAGGCAAAG AGATGCTGCA 
ATCGCCATAC ATGAACAAGC CACGTCAACA AAATTGCGGA CAATGAATGC TGAGCATCGA 
GCCTATATCG CTCAGCCTGC TGCCACTATC AGTGCGGCGC CCGCGTTAAA CGGCGATTGG 
CCTGGGGCTG TGCCACCAGA GCGCAATCGA TTTGAGAAAC AAGTGCAAAA CGGCATCATG 
GTTGCGGGGG AAACCCCTGT CTCGACCTTT GCTATCGATG TCGATACTGG TAGTTACACG 
ACGTTAAGGC GAATGCTAAA GGAGGGGCGA TTACCGCAAA AGGACACGCT GCGGGTCGAA 
GAAATGCTGA ATTATTTTTC CTATGACTAT CCATTACCGA GTAAAAATGA GGCGCCATTT 
AGTGTTACCA CTGAGCTTGC ACCATCGCCC TATAACTATG ACATGATGTT ACTTCGCATC 
GGTTTGAAGG GATATGAGCA GAGTAAAGCA GAACTCGGCG CCAGTAACTT AGTGTTTCTG 
CTGGATGTGT CAGGGTCGAT GGCATCGCCC GATAAATTAC CTCTATTGCA AACTGCCTTG 
AAAATGCTGA CTCAGCAACT GGGTGCTCAG GATAAGGTAT CGATTGTCGT CTACGCTGGC 
GCAGCTGGTG TGGTGTTAGA TGGCGCGGCG GGTAACGACA GTCAAACCCT TAACTATGCG 
TTAGAGCAGC TCAGTGCGGG TGGTTCTACC AATGGGGCGC AGGGTATTCA GCTTGCCTAT 
CAGCTTGCGA AAAAGCACTT GGTTGAAGGC GGCATCAATC GAGTGATATT TGCGACCGAC 
GGTGACTTTA ATGTCGGCAC GACTAACCTC GATGAGTTAA TCGATTTGGT TAGCGCGCAG 
AAGCAACTGG GCATTGGGCT AACGACGCTC GGCTTTGGTA TGGGCGACTA CAATGACCAT 
CTAATGGAGC AATTAGCCGA TAAAGGCAAT GGACAATACG CCTATATTGA TTCCCTCAAT 
GAAGCGAGAA AAGTGCTGGT GGAACAGTTA AGTGCAACCT TACTGACCAT AGCCAAAGAG 
GTGAAAGTGC AGGTCGAGTT TAATCCCGCC CTTGTGGCTG AGTATCGTCT TATTGGTTAT 
GAGAACCGTG CCTTAGCGCG TGAAGATTTT AATAATGATA AGGTGGATGC GGGCGAAATA 
GGCGCTGGGC ATACTGTGAC GGCGCTATAT GAGCTGCGTT ATGTTGATGC GGGAAATTTG 
GCTAATGATA AACTTCGCTA TGGCTATAAT CCCAAGACTG GCAATGAAAA ATATAGCCGT 
GATGAAATCG CCTTTCTGAA ATTACGTTAT CAGCTACCGG ATGCGACTCA AAGCCAGTTA 
CTGAGTTATC CAATTCGTGC CGACCAAAGG GCAAACTCAT TAGCGCAGGC GAGTGACGAT 
TTTCGTTTTG CCGCTGCAGT GGCAGGATTA GGACAGTTAC TGAATCAAAG CCACTATTTG 
CATCAATTTG ATTATAATAA GCTTAGTGCG CTCACACGTT CTGCGCTGGG GGAAGATACT 
AGCGGCTACC GACATGAATT TATGCAACTT GTCGATACCG CTGCGATACT CGCACAAACA 
CAGCGAGTGC CAATCAAAAA ATCCTTTGAT GCCGGAGATA AACCTTTCCC GCCCGAGGAT 
AAACCGCATC AGTGA

Protein sequence

MRYPSSVFRR KTLSSIVVSG LTLAILLGLN GCSDKSDDQQ KRAELADQTK LAAEQQAELK 
QQVELKDSVE RQANRQRDAA IAIHEQATST KLRTMNAEHR AYIAQPAATI SAAPALNGDW 
PGAVPPERNR FEKQVQNGIM VAGETPVSTF AIDVDTGSYT TLRRMLKEGR LPQKDTLRVE 
EMLNYFSYDY PLPSKNEAPF SVTTELAPSP YNYDMMLLRI GLKGYEQSKA ELGASNLVFL 
LDVSGSMASP DKLPLLQTAL KMLTQQLGAQ DKVSIVVYAG AAGVVLDGAA GNDSQTLNYA 
LEQLSAGGST NGAQGIQLAY QLAKKHLVEG GINRVIFATD GDFNVGTTNL DELIDLVSAQ 
KQLGIGLTTL GFGMGDYNDH LMEQLADKGN GQYAYIDSLN EARKVLVEQL SATLLTIAKE 
VKVQVEFNPA LVAEYRLIGY ENRALAREDF NNDKVDAGEI GAGHTVTALY ELRYVDAGNL 
ANDKLRYGYN PKTGNEKYSR DEIAFLKLRY QLPDATQSQL LSYPIRADQR ANSLAQASDD 
FRFAAAVAGL GQLLNQSHYL HQFDYNKLSA LTRSALGEDT SGYRHEFMQL VDTAAILAQT 
QRVPIKKSFD AGDKPFPPED KPHQ