Gene Namu_1270 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_1270
Symbol
ID	8446866
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	1393796
End bp	1395577
Gene Length	1782 bp
Protein Length	593 aa
Translation table	11
GC content	76%
IMG OID	645040404
Product	von Willebrand factor type A
Protein accession	YP_003200663
Protein GI	258651507
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.432707
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGATC AGTCGCCCCC GGCCGCGCAC GGCCGGCACC GCAGGTCCCC GGCCCGCCGC 
CGCACCCTGA CCGTGGTGGC CGTGGTGGTG GCCCTGGTGG CCGCGGCCGG CGTCATCACC 
TGGCTGGTGC GGTCCCGGTC GTCGACCGAT CCCGCCGCCG GCCCGGCGGC GGTGACAGTG 
ACGGCGGCGA GCCCGACCGG CAGCCCGTTC GACGGCGCGG CCGCCAGTGC CCCCGTGAGT 
GCGGGCGCGA GGTGCCCGGG TGAGCCGCTG ACCGTCGCGG TCACGCCCGA TCTCGCCCCC 
ACACTGACCG CCTTCGCCGA GCGGCAGGAC CTGACCGTGG CCGGATGCCC GGTGCGGATC 
GACGCCGTCG ACCCGGCCCA GGTCGTCGAC GGATCGGCGA CCGCCGACGT GTGGATCCCC 
GACTCGTCCA GCTGGCTGCC CCGGGCGACG GCCGCCGGGC GCACCGTCGG GCCGGACGCC 
CCGTCCATCG CCACCAGTCC CGTCGTGTTC GCCCTGTCCG GTCAGGCCCA GCAACAGCTG 
GCCGCGGCCG GTGCATCGAC CGATGTCGCC GGCCTGCTGG CCACCCGCAA GACGGCCGCG 
CCGATCCGGG TGGGCCTGCC CGACCCGCAA CGGTCGGCGG CCGCGGTGGC GGCCACCCTG 
TCCGCCCGGG CCGCGGTCAG CGGCGCCACC GACGCCCGGC CCGCCCTGAC CTGGGCGGTC 
CGCTCCAGCC CGGCCGACCT GCCGGTCGAC GACGCTCAGC TGCTGGCCCG CCTAACGTCC 
GATCCGGGCA CCGCGGTGCC GGTCACCGAG CAGTCGCTGC TCGCCTGGGA TCAGGACCAT 
CCGGACTCAC CCGCCCGGGC GCTCTACCCC GGACCCGGCG GGTTCGCCAT GGACTTTCCC 
GTCGTCGCCG TCGGCGGCGA CCCGGCCGCC ACGGCCGCCG CCCGCGAGCT GGCCACCGCC 
TTGACCACCG AACCGGCCCG CACCGCCCTG CTGGCGGCCG GTTTCCGCGC CCCGGATCAG 
ACTCCGGGGC CGGCGATCAG CGCCGCCGGG GCCGCCAGCG GCATCGACCC GGCGTACCGG 
GAGACGTCGG ACCCGCCCAC CCCGCAGGCC GTCGACGACG CCATCCGCAG CGTCCAGGTG 
ACCAACGAAG GCACCCGGAT GCTGGCCGTC ATGGACATCT CCGGGTCGAT GCTGGCCCAG 
GTGCCGGGCA CCAACGGCGC CGACCGGATC GACCTGGCCA AGGACGCCGC CGCTCGCGGC 
CTGGGCCTGT ACCGGGCGGA CAGCGACATC GGCCTGTGGG AGTTCTCCAC CCGGCTCAGC 
CCGACCAGCG ACCACCGCGA GCTCATCCCG ATCAGCTCGC TCGGGCCGGA CGGGCAGGGC 
AGCACCGGTG CCGCCCGGCT GGCCGCCGCG CTGAACGGGC TGCAGGCCAT CCCCGACGGC 
GGTACCGGCC TGTACGACAC CGTGCTGGAT GCGACCCGGA CCGTGCGGGC CGGCTACGAC 
CCCGACCGGG TCAACGTGGT GCTGCTGCTG ACCGACGGGA TGAACGACGA CGTCAACAGC 
ATCACCATGG ACCAGTTGCT CAGCACCCTG GCCGCCGAGC AGGACCCGGC CCGGCCGGTA 
CCGGTGATCT CGATCGCCTT CGGCCCGGAC AGCGACGTGG CCGCGCTCCA GCAGATCAGC 
CGGGCCACCG GTGGGGCCAC CTACCTGTCG CAGGACCCCC GGCAGATCGG CGAGATCTTC 
CTGGACGCGG TGGGCCAGCG TCTGTGCCGG CCCAGCTGCT GA

Protein sequence

MTDQSPPAAH GRHRRSPARR RTLTVVAVVV ALVAAAGVIT WLVRSRSSTD PAAGPAAVTV 
TAASPTGSPF DGAAASAPVS AGARCPGEPL TVAVTPDLAP TLTAFAERQD LTVAGCPVRI 
DAVDPAQVVD GSATADVWIP DSSSWLPRAT AAGRTVGPDA PSIATSPVVF ALSGQAQQQL 
AAAGASTDVA GLLATRKTAA PIRVGLPDPQ RSAAAVAATL SARAAVSGAT DARPALTWAV 
RSSPADLPVD DAQLLARLTS DPGTAVPVTE QSLLAWDQDH PDSPARALYP GPGGFAMDFP 
VVAVGGDPAA TAAARELATA LTTEPARTAL LAAGFRAPDQ TPGPAISAAG AASGIDPAYR 
ETSDPPTPQA VDDAIRSVQV TNEGTRMLAV MDISGSMLAQ VPGTNGADRI DLAKDAAARG 
LGLYRADSDI GLWEFSTRLS PTSDHRELIP ISSLGPDGQG STGAARLAAA LNGLQAIPDG 
GTGLYDTVLD ATRTVRAGYD PDRVNVVLLL TDGMNDDVNS ITMDQLLSTL AAEQDPARPV 
PVISIAFGPD SDVAALQQIS RATGGATYLS QDPRQIGEIF LDAVGQRLCR PSC