Gene Namu_4816 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4816
Symbol
ID	8450446
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	5362379
End bp	5363740
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	78%
IMG OID	645043855
Product	protein of unknown function DUF58
Protein accession	YP_003204080
Protein GI	258654924
COG category	[R] General function prediction only
COG ID	[COG1721] Uncharacterized conserved protein (some members contain a von Willebrand factor type A (vWA) domain)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGAGG CGAGCGGCGG CCGGCCGACC CCGGTCCCGG CCCTGGGCCC GGCGGCGGCG 
GAGGTGCCTC CAGCGGTGCC TCACGCGGTG CCCCCGCCGG TGCCCCCGCC GCCCGGGCCG 
GCCCGGGCCC GGCTGGACGG GTCGGCGCTG GCCGCGGCGT GGGCCACCGT CACCCGGCGC 
GGCCGGGTGG CGCTGGCGGT GCTGGTCGGC GCCGCCCTGG TCGGCTGGCT GACCGGGTGG 
CGCGAATGGA CCGGGCTGGC CGCGGGGCTG GCCGTGGTGA TGCTGGTCGC CGTGGCGATG 
GCGCTGGGCC GCTCACCGGT CGCGATCGAT CTGGATCTGG CCCGCACCCG GTTCGTGGTC 
GGTGACCCGG CGGTCGCCCG GGTCGGGGTG CGCAACGTCT CCGGCCGGCG GATGCTGCCG 
CTGCGGTTGG AGCTGGACGT CGACGGCCTG CCCGCGCAGG TGCGGGTGCC GTCCCTGCCG 
GGCGGGGCCG CCCACCCGGT GGTCATCCCG CTGCCCACGC ACCGCCGGGG GGTCATCGAG 
CTGGGGCCCG CCCGTGCCGT GCGCGGGGAC GTGTTCGGCC TGCTGCGCCG GGTGGTCCAG 
TGGCCGGTGC ACGAGCAGGT GTACGTGCAT CCGCGGACGG TGCAGCTGCC CGACCCGCTG 
CCCGGCCGGG CCCGGGACCT GGAGGGGGAG GAGTCGGCCA TCCGCACGGC CAGCGACCTG 
TCGTTCCACA CGCTGCGCGA CTACGTGCCG GGCGATGACC GCCGCTTCAT CCACTGGAAG 
TCGACCGCCC GCAGCGGCAC GCTGCAGGTC CGCGAGTTCC TGCAGACGCA CCGGTCGCTG 
GTCGCGGTGG TATTGGCCGG CAACCCGGAC GACTACCGCG CGGCCGGCTG GTCGCCGGGG 
GCCGCCGGCG ACGGGTCCGA CGCGGGCACC TCGCCGGAGT TCGAGGTCGC GGTCAGCTGC 
GCGGCCTCGA TCGTGGCCGA GCTGGTCCGG CGCCACCGCG ACGTCGTGGT CGACGCGGCC 
GGTTCGGCGA TCCGCGCCGC CTCGGACCAG GGTGTGTTGG ACCGGTTCAG CCCGGTGCGC 
ACCGTCGCCG GTTCGCCCGA CCTGCTGGCC ATGACCCGGC AGGTGGCCCG CCGGCACCCG 
CGCACCTCCC TGGTGGTGCT GGTGTTCGGG TCCACCGTCG AGCCGGCCCG GCTGCGCGCG 
GCCGCCCGGC TGGGCCCGAC CGGCGCGACC GTGCTGGCGG TGCGGGCCCG GGTGCCGGAC 
TCACCGCACC CGGCCACGCT GGCGCCGCTG AGCACGGGGG CCGTCGTCAC CGTCGAGGAC 
GTGGCCCAGC TACCGCTGGC CCTGCGCGGG GTCCGGCGAT GA

Protein sequence

MSEASGGRPT PVPALGPAAA EVPPAVPHAV PPPVPPPPGP ARARLDGSAL AAAWATVTRR 
GRVALAVLVG AALVGWLTGW REWTGLAAGL AVVMLVAVAM ALGRSPVAID LDLARTRFVV 
GDPAVARVGV RNVSGRRMLP LRLELDVDGL PAQVRVPSLP GGAAHPVVIP LPTHRRGVIE 
LGPARAVRGD VFGLLRRVVQ WPVHEQVYVH PRTVQLPDPL PGRARDLEGE ESAIRTASDL 
SFHTLRDYVP GDDRRFIHWK STARSGTLQV REFLQTHRSL VAVVLAGNPD DYRAAGWSPG 
AAGDGSDAGT SPEFEVAVSC AASIVAELVR RHRDVVVDAA GSAIRAASDQ GVLDRFSPVR 
TVAGSPDLLA MTRQVARRHP RTSLVVLVFG STVEPARLRA AARLGPTGAT VLAVRARVPD 
SPHPATLAPL STGAVVTVED VAQLPLALRG VRR