Gene Shewana3_3153 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewana3_3153
Symbol
ID	4477747
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. ANA-3
Kingdom	Bacteria
Replicon accession	NC_008577
Strand	-
Start bp	3780541
End bp	3782382
Gene Length	1842 bp
Protein Length	613 aa
Translation table	11
GC content	50%
IMG OID	639727757
Product	von Willebrand factor, type A
Protein accession	YP_870783
Protein GI	117921591
COG category	[R] General function prediction only
COG ID	[COG2304] Uncharacterized protein containing a von Willebrand factor type A (vWA) domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.573485
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.703806
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGATATC CATCTTCAGT CTTTCGCCAT AAAGCGCATT TAAGTTTTGT TGTTTCGGGA 
TTAACGCTCG CTATTTTGCT CGGTTTGAGT GCTTGCAGTG ATAAAGCCGC CGAGCAGCAA 
ACCCCTGCTG AATTAGCCGC TCAAGCAAAA CTCGCCGCCG AGCAACAGGC CGAGCGTCAG 
GCCAATAGGC AAAGAGATGC CGCAATCGCC ATGCATGAAC AAGCCTCGTC AGCAAAACTG 
CGGACAATGA GTGCTGAGAG TCGAGCCTAT ATTGCGCAAC CTACTGCCAG TATCAGTGCT 
GCGCCCGCGT TAAACGGCGA TTGGCCGGGG GCTGTGCCAC CCGAGCGCAA TCGCTTCGAG 
AAGCAAGTGC AAAACGGCAT CATGGTTGCG GGGGAAATCC CGGTCTCCAC CTTTGCTATC 
GATGTCGATA CTGGTAGTTA CACGACCTTA AGGCGAATGT TAAAGGAAGG GCGGTTACCA 
CAGAAGGACA CGCTGCGGGT TGAGGAAATG CTGAATTATT TTTCCTATGA CTATCCACTG 
CCGGGGAAAA ATGACGCGCC CTTTAGTGTT ACGACCGAGC TTGCACCATC GCCCTATAAC 
GATGACATGA TGTTACTTCG CATCGGTTTG AAGGGATATG AGCAGAGTAA GGCTGAACTG 
GGCGCCAGTA ACTTAGTGTT TCTGCTGGAT GTGTCAGGGT CGATGGCATC GCCCGATAAG 
TTACCTTTGC TGCAAACTGC CTTGAAAATG CTGACCCAGC AATTGGATGC TCAGGATAAG 
GTATCGATTG TCGTCTACGC CGGCGCCGCT GGTGTAGTGT TAGATGGTGC AGCTGGTAAC 
GATACTCAAA CCCTTAACTA TGCGTTAGAG CAGCTTAGTG CCGGCGGTTC AACCAATGGG 
GCGCAGGGGA TTCAGCTTGC CTATCAGTTA GCGCAGAAAC ACTTTGTTGA AGGCGGCATC 
AATCGAGTCA TTCTCGCGAC CGACGGTGAC TTTAATGTCG GCACGACCAA CCTCGATGAG 
TTAATCGATT TGGTTAGCGC GCGGAAACAA CAGGGCATAG GGCTCACGAC ACTCGGCTTT 
GGCATGGGCG ACTACAATGA CCATCTGATG GAGCAATTGG CCGATAAGGG CAATGGGCAA 
TATGCCTATA TTGATTCTAT CAATGAGGCG AGAAAAGTGC TGGTGGAACA CTTAAGTGCA 
ACCTTACTCA CCATAGCAAA AGAGGTGAAA GTGCAGGTCG AGTTTAATCC CGCTCTTGTG 
GCCGAGTATC GCTTGATTGG CTATGAGAAC CGAGCGCTCG CGCGTGAAGA TTTTAATAAT 
GACAAGGTGG ACGCGGGCGA AATTGGCGCA GGGCATACAG TCACGGCGCT TTACGAGCTG 
CGTTATGTTG ATGCGGGGAA TTTGGCCAAT GATAAACTTC GCTATGGCTA TAATCCCAAA 
ACGGGCAATG AAAAATATAG CCGCGACGAA ATCGCCTTTC TGAAATTACG TTATCAGCTA 
CCGGATGCGA CTCAAAGCCA GCTACTGAGT TATCCGATTC GAGCAGACCA AAGGGTAAAA 
TCATTAGCGC AGGCGAGTGA TGATTTTCGT TTTGCCGCTG CAGTGGCTGG TTTAGGACAG 
TTGCTGAATC AAAGCCACTA TTTGCATCAA TTTGATTATA ATAAGCTTAG TGCGCTCACA 
CGTTCTGCGC TGGGGGAAGA TACCAGCGGC TACCGACATG AATTTATGCA ACTTGTCGAT 
ACCGCTGCGG CACTCGCACA AACACAGCGA GCACCAATCA AAAAATCCTT TGATGTCGGA 
GATAAACCTT TCCCGCCCGA GGACAAACTG CATCAGCAAT GA

Protein sequence

MRYPSSVFRH KAHLSFVVSG LTLAILLGLS ACSDKAAEQQ TPAELAAQAK LAAEQQAERQ 
ANRQRDAAIA MHEQASSAKL RTMSAESRAY IAQPTASISA APALNGDWPG AVPPERNRFE 
KQVQNGIMVA GEIPVSTFAI DVDTGSYTTL RRMLKEGRLP QKDTLRVEEM LNYFSYDYPL 
PGKNDAPFSV TTELAPSPYN DDMMLLRIGL KGYEQSKAEL GASNLVFLLD VSGSMASPDK 
LPLLQTALKM LTQQLDAQDK VSIVVYAGAA GVVLDGAAGN DTQTLNYALE QLSAGGSTNG 
AQGIQLAYQL AQKHFVEGGI NRVILATDGD FNVGTTNLDE LIDLVSARKQ QGIGLTTLGF 
GMGDYNDHLM EQLADKGNGQ YAYIDSINEA RKVLVEHLSA TLLTIAKEVK VQVEFNPALV 
AEYRLIGYEN RALAREDFNN DKVDAGEIGA GHTVTALYEL RYVDAGNLAN DKLRYGYNPK 
TGNEKYSRDE IAFLKLRYQL PDATQSQLLS YPIRADQRVK SLAQASDDFR FAAAVAGLGQ 
LLNQSHYLHQ FDYNKLSALT RSALGEDTSG YRHEFMQLVD TAAALAQTQR APIKKSFDVG 
DKPFPPEDKL HQQ