Gene Dred_2244 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dred_2244
Symbol
ID	4955406
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum reducens MI-1
Kingdom	Bacteria
Replicon accession	NC_009253
Strand	-
Start bp	2453286
End bp	2454536
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	47%
IMG OID	640181417
Product	von Willebrand factor, type A
Protein accession	YP_001113581
Protein GI	134300085
COG category	[R] General function prediction only
COG ID	[COG2304] Uncharacterized protein containing a von Willebrand factor type A (vWA) domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0785649
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAACAAA TTCAAATTGA TCTTGCTCTA GATAAGACCT ATCTGCTACC AGGTAATAAG 
CAGGTGGCCT ATCTGATGGT AAAGCTTACT GCGCCTAAGC AAGTGGAGAA GGAAAGGCCG 
GTGCAGAATC TGTCCTTTGT TATTGACCGC AGCGGCAGTA TGGCAGGGGA AAAGCTAGAC 
TACACCAAAA AGGCAGTTGC CTTTGCGGTT GGTCATCTAA GTCCACAGGA TTACTGCTCG 
GTAGTAGCCT TTGACGATAT GGTAACGATG GTGGCCTCCT CTCACCAGGT GGCAAACAAA 
GATGCACTTA AGATGGCGGT GGAAAGTATC TATCCCGGTG GCAGCACAAA CCTAAGCGGC 
GGCATGCTGC TGGGCGTAAG GGAAGTAAAG CTGGCCCACA AAGAGAATCA AATCAACCGG 
GTGCTGCTGC TAACAGATGG CATGGCCAAT GTGGGAGTGA CAGACCACAG TGCCCTGGTG 
GAGAAGTCCC GGGAAATGGC TGCCGGTGGG GTTAATCTTT CTACCTTTGG TTTGGGGGAA 
GATTTTGAAG AAGATTTATT GCAGGCAATG GTGGAGGCTG GGGGCGGTAA CTTCTATTAT 
ATAGAAAAAC CGGATCAAAT ACCTGGTATT TTTGAACAGG AATTAACTGG GTTGCTAAGT 
ATCGTGGCCC AAAATCTCTC AGTAAAAGTG AAACCGGGGC AAGGTGTGTC TATAACCGGA 
GTGCTTGGTT ATCCCTTTAG CTCCGAGGAA GGGGTTACTG TAAACCTGCC GGATATTTAT 
AGTGGTGAAT CAAAGCTATT GCTACTGGAG TTGCTTATTT CGCCGCTGAC GGAAGGTAAT 
CACAAGCTCA TCAGTGTAGA GTTGGATTAT GCAGACGTTC GAAAAAGCCT GGCGCTGGTG 
AATCTCAAGG CAGAGCTAAG TATAAATGCT AGTGCGGAAA TAGGGGATGA ACCTGCTGAA 
AACATAGAGG TGATCAAGCA GGTGGAACTA TTCCGCTGTG CTCAGGCTAA GGAAGAAGCT 
ATTCGGTTAG CTGATCAGGG AGACTTCCAG GCTAGTCGTC TTGTCTTGGA AAATCAGTTA 
TATAAGCTAC AGTCTTTGGG AGCTTGTTTA GATTCTAGTG ATCTTAATAT GGAAGTAAAC 
GAATTACAGG AAAACCTTTG CTTTATGTCC GAGGGCAGTT ATGATAAGGC CTCACGGAAG 
AAAATGTCCT TTAACGCTTA CCAACGGAAG AAAGGGAGAG GTAGAAAATA A

Protein sequence

MEQIQIDLAL DKTYLLPGNK QVAYLMVKLT APKQVEKERP VQNLSFVIDR SGSMAGEKLD 
YTKKAVAFAV GHLSPQDYCS VVAFDDMVTM VASSHQVANK DALKMAVESI YPGGSTNLSG 
GMLLGVREVK LAHKENQINR VLLLTDGMAN VGVTDHSALV EKSREMAAGG VNLSTFGLGE 
DFEEDLLQAM VEAGGGNFYY IEKPDQIPGI FEQELTGLLS IVAQNLSVKV KPGQGVSITG 
VLGYPFSSEE GVTVNLPDIY SGESKLLLLE LLISPLTEGN HKLISVELDY ADVRKSLALV 
NLKAELSINA SAEIGDEPAE NIEVIKQVEL FRCAQAKEEA IRLADQGDFQ ASRLVLENQL 
YKLQSLGACL DSSDLNMEVN ELQENLCFMS EGSYDKASRK KMSFNAYQRK KGRGRK