Gene Namu_3858 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3858
Symbol
ID	8449477
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	4228965
End bp	4230014
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	74%
IMG OID	645042906
Product	cobalamin synthesis CobW domain protein
Protein accession	YP_003203142
Protein GI	258653986
COG category	[R] General function prediction only
COG ID	[COG0523] Putative GTPases (G3E family)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.0342119
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTCCCG TGGCGATTCT GGCGACCGTC GACCCCGTGC TGCGCGACGC CGCTCTGCTG 
TCCCTGCTCA CTGATCTGCC CGGCACCGGG GTGCTGGCCC AGGACCTGGA TCCCGACACC 
GGCACGTTGC GCCGGATCGT CAGCGACCAG CACGGCATCG CCGAGGACAG CACCCGGCCG 
TTGGCGCACG CCTGCCTGGG CTGCGCGATC CGGGAGGACT CGGTGCCCAC GTTGGAGTCC 
ATGGCCGCGG CCAGGCGGTG GGAGCGGATC ATCTGGGCGC TCCCGGTCTC GGCCGAGACC 
GCCCCGGCGG CCCGGCCGCT GTGCCGACCG GATGCCGTGC CCGGCCTGGA GCTGGCCACC 
GTCGCCTGCG TCGTCGACGC CGACCAGGTC GAGGCCGATC TGATGGGGGA CGAGCTGCTG 
GCCGACCGGG ATCTGGCCCT GTCGGCCGAC GACCGGCGGT CGGTCGGCGA GGCCTCGGCG 
GCCCAGCTCG GGCACGCCGA CCTGGTCCTG ACCATCGGTG AGGACCCGGT CGGGTTGACC 
CTGGCCGACC ATCTGCGCGG CCGCCGCACC CTGCGCTCCA CCCTGTTCGG CATCCGCGCC 
GAGCAGGTGT TCGCCCCCCG GCACTCGGCC CGGCACGCCG AGGCGCGGAT CGATCCGTGC 
CGCATCCAGG CTCCGGATGC CCCGGACGCG CATGGGGTCT GGAGCCTGGA CCTGCTCAGC 
CCGCGCCCGG TGCACCCGGG CCGGTTCCTG GCCGGGATCG GTGAGCTGGC CGGTGGCCGC 
ACCCGGTCCC GGGGCCGGTT CCACCTGCTC AGCCGGCCGG GACGGGTGGC CGTGTGGGAC 
GGGGCCGGGC GTCAGCTGTC CATCGGCGAC GGTGGTCCGT GGCGGGTCGG CACCCCGTCC 
ACCCGCATCG TGTTCACCGG GGTGGACGAC GACCGGGCCC GAGTGGCCCA AGGTTTCGCT 
CGGATGCTGA TGACCGACGA CGAGCTGGCC GGGTCGATGC GAGTCCGCCA CGAGGACGAC 
GGACTGGACG GCTGGCTGGG CGCCCGCTGA

Protein sequence

MIPVAILATV DPVLRDAALL SLLTDLPGTG VLAQDLDPDT GTLRRIVSDQ HGIAEDSTRP 
LAHACLGCAI REDSVPTLES MAAARRWERI IWALPVSAET APAARPLCRP DAVPGLELAT 
VACVVDADQV EADLMGDELL ADRDLALSAD DRRSVGEASA AQLGHADLVL TIGEDPVGLT 
LADHLRGRRT LRSTLFGIRA EQVFAPRHSA RHAEARIDPC RIQAPDAPDA HGVWSLDLLS 
PRPVHPGRFL AGIGELAGGR TRSRGRFHLL SRPGRVAVWD GAGRQLSIGD GGPWRVGTPS 
TRIVFTGVDD DRARVAQGFA RMLMTDDELA GSMRVRHEDD GLDGWLGAR