Gene GYMC61_2540 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GYMC61_2540
Symbol
ID	8526408
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. Y412MC61
Kingdom	Bacteria
Replicon accession	NC_013411
Strand	-
Start bp	2572209
End bp	2574113
Gene Length	1905 bp
Protein Length	634 aa
Translation table	11
GC content	58%
IMG OID
Product	von Willebrand factor type A
Protein accession	YP_003253615
Protein GI	261419933
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGCGGT TTATGATGTT CAATGACCGA ACGGTCGACT CGAGTTTGGT CATGCAGCTT 
TCTGACCTCG CCCAAACGCT CATGCGCCGC CGCGACGTTG CCATCCAGTT CGCCGCCCAT 
TCCGGCGTGC ATTGTGTCAA GCCGGTCGTT TACGTCAGCC ATTTTTGGGA AGGGTATCCA 
CCATTGGAGC GGGAAACGGC AATGAAAAGC GACGTCGGCT TGCGCATCAT CGGCACGTAT 
CGGCACACCG ACCGATTGGC GGTTCGCGCC TTCCGACATG CGGTGGAATC CCGACCGCTC 
TCCAAGCTTT CCAAACAGCT GTTTACATTC GCTGAAGATC TTCGCTTGGA AGCCGTCTGC 
GAGCGGGAAC GTCCCGGGAT GAAGCGATGG TTCCGCACGC GCCGCCGCAT GTACCGCCGC 
TACTTCACTC AGCAATGGCA AGCAAACAGG ACGCGCGGCG CTTGGGCTGA TCAGTTTTTG 
GCGGGGATGT ATTTGCGGCT CACGGCCGAT TCGCCGCTTG ATGATGCGCC GCTGGCTCCG 
ATGGCGGATG AAGCGGTGCA GGCGCGCCTC GAAACGTTAT GGCCGCAATT TTTTGATGCT 
TCCTCGACAG CCGAGGTGGC GGACTGGGCG TTCGCCGTTG TGGAACTGAT GGAGGACGTG 
CTGCCTCATG ATATGGTCAA TGCCTATACA TCGCTGCCAA TCGTTGAGGA TGGTGCGGAC 
GAGAAAACGA TGACGCTTCA AGATCTCAAA CGGACCAACC CATTGGAAAA CCGCGATGCC 
CTTCAAGAGG CGGATGGAGA GGCCAAGCGG CAAGTGCTGC CAACATGGCA TCGGGAAACG 
AGCCGGGCGG GTGGAAGCTT TCTCCGCTTT GAGCTCGAAC GAGGCAGCCG CACCGAGATC 
ATCAGCGATG AGGCGAGGCC GGGTGAAGAC GGCGATCAGG CTCTGGCCGT CGTGAAAGGA 
ACGTCTCGGC CGACGGCGCG AAACGAGTAT GGCCTGGAAG CGCAAGCATC CTTCAGCGAA 
CAGCCGCCGG CTGGAAACAG TGCGCCGTAT GGCGAGGCCA ACCGCCAAGC CGATCTTGTG 
CTTCTTCCTT CGTCGCCAAA CCTCGCGCAT CTTGAGCAAT ACCGCGCCAA ACAGGCGGCG 
GTGGCGCCGT ACCGAAAACG GCTTGTGCGC ATCATGGAAC AATGGCTTGA ACACAAGCGC 
TCCGCTTGGC GCACGAACTT GCCCGTCGGT CGGCTGCGCA AACAATTGGT GTCGTTTTTC 
ATTGATGAGC GGCCGCGCTT GTTTTGCAAA AAAGGCGAGC CGACGCGGCG GTTTGATGCG 
GTCTTCGGCC TGCTTGTCGA TTGCTCGGCT TCGATGCATG ACAAAATGGA AGAGACGAAA 
ACCGGGCTCG TTCTTTGCCA TGAGGTGCTG AAAACGTTGC GCGTGCCGCA CCAAATTGTC 
GGATTTTGGG AAGATGCGAA CGAAGCAACC GCTTCGCGTC AGCCGAACTA TTTGCAGATG 
GCGGTCTCAT TCCATCGCTC GCTTGAGCCG TCGAGCGGCC CGGCGATCCT GCAGCTCGAG 
CCGCATGAAG ATAATCGCGA TGGATTGGCG ATTCGCTGGA TGACCGAACA GCTCCTCAAG 
CGCCCGGAAG CACAAAAAGT GCTGCTCGTC TTCTCTGACG GCGAACCCGC CGCGTACGGA 
TATGAACAAA ACGGCATCAT CGATACGCAC GAAGCAGTCG CCGAAGCGCG CCGCCGCGGC 
ATTGAGGTCG TCAATCTCTT TTTAGGCCAC GGGGCCGACG ATGAGTCAAC GCGGCGGACG 
ATTGAAAACA TCTATGGTCG CTTCCGCGTC TTTGTTCCGC ATGTGAGCGA GTTGCCGGAT 
CGGCTGTTGC CGCTCTTGAA AACGTGGTTG CAAAAAAGTT TGTGA

Protein sequence

MERFMMFNDR TVDSSLVMQL SDLAQTLMRR RDVAIQFAAH SGVHCVKPVV YVSHFWEGYP 
PLERETAMKS DVGLRIIGTY RHTDRLAVRA FRHAVESRPL SKLSKQLFTF AEDLRLEAVC 
ERERPGMKRW FRTRRRMYRR YFTQQWQANR TRGAWADQFL AGMYLRLTAD SPLDDAPLAP 
MADEAVQARL ETLWPQFFDA SSTAEVADWA FAVVELMEDV LPHDMVNAYT SLPIVEDGAD 
EKTMTLQDLK RTNPLENRDA LQEADGEAKR QVLPTWHRET SRAGGSFLRF ELERGSRTEI 
ISDEARPGED GDQALAVVKG TSRPTARNEY GLEAQASFSE QPPAGNSAPY GEANRQADLV 
LLPSSPNLAH LEQYRAKQAA VAPYRKRLVR IMEQWLEHKR SAWRTNLPVG RLRKQLVSFF 
IDERPRLFCK KGEPTRRFDA VFGLLVDCSA SMHDKMEETK TGLVLCHEVL KTLRVPHQIV 
GFWEDANEAT ASRQPNYLQM AVSFHRSLEP SSGPAILQLE PHEDNRDGLA IRWMTEQLLK 
RPEAQKVLLV FSDGEPAAYG YEQNGIIDTH EAVAEARRRG IEVVNLFLGH GADDESTRRT 
IENIYGRFRV FVPHVSELPD RLLPLLKTWL QKSL