Gene Amir_5347 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_5347
Symbol
ID	8329549
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	+
Start bp	6361708
End bp	6363498
Gene Length	1791 bp
Protein Length	596 aa
Translation table	11
GC content	76%
IMG OID	644945785
Product	von Willebrand factor type A
Protein accession	YP_003103013
Protein GI	256379353
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.23692
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTCGAC ACCGCACGCT GCGGACCAAG GTGCGGCGCG GCATCGCCGG GTGGCCCATC 
ACCATCATCG GCGTCGTGGC GCTGCTGGTG CTCGGCTGGT TCGGCTGGCG GTGGATCGGC 
GACGTGGTCG ACCAGCGCGC GGCCGTGCAG GCCGGGGACT GCAACGAGGG CCCGGCGACG 
TTGAAGGTCG CCGCGACCCC CAGCGTGGCG GACGCGGTGC GGCAGGTCGC GCAGGCGTGG 
AGCGCGCAGC GGCCCGTGGT GTACGACCAC TGCATCGGCG TCGAGGTCCT CGCCAGCGAC 
TCCGAGGTGG TCCTGGAGGG CCTGACGAAC ACCTGGGACG AGGAGAAGCT CGGTTCCCGG 
CCGCACGCGT GGGTCACCGA CTCGGCGGTG TGGGCGAACC GGCTGGCCGC GCAGCGCCAG 
TCCATGATCG GGTCCCCGCC GGAGTCGATC GCGACCAGCC CGGTGGTGCT GGCCATGCCG 
CAGGAGGCGG CGGACGCGGT GCAGGCCGGG CCGGGGTTCC GGTGGACGGA CCTGACCGCG 
ATGACCTCGT CGGCGACCGG CTGGGACCGG TTCGGCAAGG CCGGGTGGGG GGCGTTCAAG 
GTCGCCATGC CCGACCCGGC GGTCAACCCC GGCACGGCCA TGGCGCTGGA GGCGGCGCTC 
GCGGGCGCGG GCGCCGACCC GACGGGGCCG GTGACGGCGG ACCTGCTGGC GCAGGAGCCG 
GTGAAGCAGG CGATGGCGAA GCTGGTCGCG GCGCGCCCGG AGCAGACGAC GACCAGCACG 
TGGCAGGCCA TGGCGGTGCT CGCGGCGAAC CCGGCGGTCG GCTCGGTCGG GTTCAGCGCG 
GTGCCCGCGC TGGAGGTCGA CCTGTACCGG CACAACACCG GCGCGGAGGA CAACCGCCCG 
GCCCCGGCGA CGCCGCTGGC GGGGGTGGCC GCGCAGGGCG TGACGCCGGT GGCGGACTTC 
CCGTTCACCG CGCTGTCGGG TGAGTGGGTG AACGAGGCGC AGGCGCGGGC CGCGCAGGCG 
TTCCGGACCT TCCTGAAGGC CCCCGAGCAG CGGGCGACGC TGGCGGCGGC GGGACTGCGG 
GTGGAGGGCG TGACCGAGCG GCCGAGCCCG GCGCCCGGCA TCGCGTGGGC CGAGGTGACC 
GAGCAGCTCA AGCCCGCCGA CGCGGCGGCG ACGCAGCAGG TGGCGGGCGC GTGGGCGACC 
GCCGACAACG GGCAGGTCGT GACCGTGCTG GTGGACACCT CGAAGACGAT GGGCGAGGAC 
GGCGGCGACG GGCGCACCCG GCTGGAGTGG GTGCGGGAGG CGCTGACCGG GCAGGCGAAC 
CGGGCGGTGT CCGGGTCGCT CGGGCTGTGG GAGTTCGCGA CCGGGGCCGA CGGGGACAAG 
GCGTACCGGG AGCTGGTGCC GACCGGGTCG GTGGGGGCTC AGCGGCAGTC GCTGCTGGAC 
GCGGTGGGAC GGCTCAAGCC GCGCGGCGAC GACCGGCCGT TCACGGCGCT GATCGCGGCC 
TACGAGGACG TGCTGGCGGA CCACCGGGAC GGGAAGCGCA ACCGGATCGT GGTGATCACG 
GACGGCGGGG CCGACGGGGA CCTGTCGCCC GCCGACGCGA AGGCGCACCT GGAGGGGCTG 
AAGGTCGCGG GCAAGGACGT CGGGATCAGC GTGGTCGCGC TGGGGGGCGG CGCGGACGGG 
CCGGGGCTGT TCCAGGACAT CACGAAGGCG TTCGGCGGCG GGACGGTGTC GGTGGTGGAG 
GACGGGAGCG GCGTGGACGC GGCGCTCGGT CAGGTGCTGG CCGGGCGGTG A

Protein sequence

MSRHRTLRTK VRRGIAGWPI TIIGVVALLV LGWFGWRWIG DVVDQRAAVQ AGDCNEGPAT 
LKVAATPSVA DAVRQVAQAW SAQRPVVYDH CIGVEVLASD SEVVLEGLTN TWDEEKLGSR 
PHAWVTDSAV WANRLAAQRQ SMIGSPPESI ATSPVVLAMP QEAADAVQAG PGFRWTDLTA 
MTSSATGWDR FGKAGWGAFK VAMPDPAVNP GTAMALEAAL AGAGADPTGP VTADLLAQEP 
VKQAMAKLVA ARPEQTTTST WQAMAVLAAN PAVGSVGFSA VPALEVDLYR HNTGAEDNRP 
APATPLAGVA AQGVTPVADF PFTALSGEWV NEAQARAAQA FRTFLKAPEQ RATLAAAGLR 
VEGVTERPSP APGIAWAEVT EQLKPADAAA TQQVAGAWAT ADNGQVVTVL VDTSKTMGED 
GGDGRTRLEW VREALTGQAN RAVSGSLGLW EFATGADGDK AYRELVPTGS VGAQRQSLLD 
AVGRLKPRGD DRPFTALIAA YEDVLADHRD GKRNRIVVIT DGGADGDLSP ADAKAHLEGL 
KVAGKDVGIS VVALGGGADG PGLFQDITKA FGGGTVSVVE DGSGVDAALG QVLAGR