Gene Namu_5290 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_5290
Symbol
ID	8450923
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	5909250
End bp	5910509
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	77%
IMG OID	645044323
Product	VWA containing CoxE family protein
Protein accession	YP_003204545
Protein GI	258655389
COG category	[R] General function prediction only
COG ID	[COG3552] Protein containing von Willebrand factor type A (vWA) domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	61
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCTGAGC CGGACCTGAG CCTGGGCGCC GATCTGGCCA CGGTCGGCGC GCTGCTGGCC 
GACCGGCTGG CCCGTCACGG GGTGCCGGTG CCGGTGCACC GGGCGGTCTG GTGGACCCGG 
GTGGTGATGG CCGGCGGGCC GACCACCGTG GACGAGTTGT ACTGGCTGTC CCGGGTCAGC 
CTGATCGACC GGCACGAGCA CCTGCCGACC TTCGACGCGG TGTTCGCCGG ACTGTTCGGC 
GCCGGCACGG CCGCGCCGCC GGACCCGGCC GCGTTCCGGG GCGATCAGAA CAACGAGCTG 
CCCCCGGCCG CGGCCGCCGG GTCACCGTCG CCGCCCCAGG CCCCGGACGC CCCGCCGCCT 
CCGACGCGTG ACGAGCAGCC CACGGTGCAG CAGGTGGGCG ACGACGAGGA CACCGGGGCC 
GAGCCCGAGG AGGACCAGTC GCCGGGCGTG GCCGCCGTGG CCTCGTCGAT CGAGCTGCTG 
CTGGCCAAGG ACTTCGCCGA CTGCGACGCG GACGAGATCG CCGAGCTGAA CCGGATCGTG 
GCCCGGATGC GGATCGTCGC GCCCACCCGG CCGGCCCGCT GGAAACCCAC GCTGGGGCCG 
GGCCGGTCGG TGGATCTGCG GCGGACGCTG CGCCGGGCCA GCCGCACCGG CGGGGACCCG 
GTGCGCTGGG TCCGCCGGCG CCGCAGCGCC GTGCCCCGGC GGGTCGTGCT GCTGGCCGAC 
GTGTCCGGGT CGATGCAGTC CTACGCCCGG GTCTACCTGC GGGTGCTGCA GGGGGCCGCG 
CTCGGCGCCC GGGCCCACGC CTACCTGTTC GCCACCCGGC TGCATCCGGT CACCCGGGCA 
TTGGTCCGCG GCCCCCGCGA GGGCGGCATC ACCCGGGCCA TGGCCCAGTC GCCGGACGCC 
TCCGGCGGCA CCCGGATCGG CGCGGCGATC AAGGAATTCC TGGACACCGA CGGCCGCCGG 
GGCCTGGCCC GCGGCGCGGT GGTCGTGGTG GTCTCCGACG GCTGGGAGCG GGCCGATCCG 
GCCCTGCTGG GCGAGCAGAT GGCCCGGCTG CACCGGCTGG CCCACTCGGT GATCTGGGTC 
AATCCGCGCA AGGCCGCCCC CGGCTTCGCC CCGCTGGCCG GCGGGATGGC CGCCGCGCTC 
CCGCACGTCG ACCGGTTCAT CGAGGGGCAC TCGGCGCGGT CGGTGCAGGG ACTGCTGGAC 
GCGATCGCCG ACAGCACCGG CGGGCCGGTC GGCGCCGCCC GCCCCGGCCG GCCGGGCTGA

Protein sequence

MAEPDLSLGA DLATVGALLA DRLARHGVPV PVHRAVWWTR VVMAGGPTTV DELYWLSRVS 
LIDRHEHLPT FDAVFAGLFG AGTAAPPDPA AFRGDQNNEL PPAAAAGSPS PPQAPDAPPP 
PTRDEQPTVQ QVGDDEDTGA EPEEDQSPGV AAVASSIELL LAKDFADCDA DEIAELNRIV 
ARMRIVAPTR PARWKPTLGP GRSVDLRRTL RRASRTGGDP VRWVRRRRSA VPRRVVLLAD 
VSGSMQSYAR VYLRVLQGAA LGARAHAYLF ATRLHPVTRA LVRGPREGGI TRAMAQSPDA 
SGGTRIGAAI KEFLDTDGRR GLARGAVVVV VSDGWERADP ALLGEQMARL HRLAHSVIWV 
NPRKAAPGFA PLAGGMAAAL PHVDRFIEGH SARSVQGLLD AIADSTGGPV GAARPGRPG