Gene Namu_3186 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3186
Symbol
ID	8448800
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	3509115
End bp	3510359
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	72%
IMG OID	645042266
Product	glycosyl transferase group 1
Protein accession	YP_003202507
Protein GI	258653351
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.00148125
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0000469398
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCGACCG AAGCCCACCG ATGGATCGTC GTCGCGGATT CGGAGTTCCT TCCGGCCCGA 
GACGGTGGCG AGCGCGAACA GCAGGGCCTG GTCGAGGCCA CGCTGGCCGC GAATGCCCTG 
CGCGCCCTGG TCATCCCGGC CAAGCAGGAG CTCGACCTGC GGGCCTACCG TGAGCTGGTC 
GGCGACATCT GTGTGCTTCC GGTGCACCGG CGCCGCTCGC CGTTGATGCT GCTGCATCCG 
CGGCACCCGT TTGTCGTGGC CTCGCGGCCG ACCCCACCGG GCCTGGCGAA CCGGCTCCGG 
TCGCTCGTGC CGGACGCCAC GGGAATCTTT GTGCTGTCCT ACAAGTCGCA CGGGATCGGG 
GACCGGTTGG CGCGCGACCT GGGGCTGCCG ATGGTCGTCC GACAGCACAA TCGCGAGTCC 
GACTACCACC GCAGCCTGGT CGAGGGCTCG CACGGTCCCC GGCGGCTGGT GATGCGCTGG 
GAGAGTGCCC GGATCGCGCG AGACGAGGCC CGGCACGACC GGTCCGACCT GGTCACCGCG 
TTCGCCGACA TCGCCGCGGA GGACGCGCAA CGCCGGCGGG CCGCGGGGGC CCGGCAGGTG 
ATGCACGTGC CGCCCTTCGT GTTCGGCCGC GGCGGGGCGG ACCGGGCCGG TGCATTGCCC 
CGGCAGGCCG GTCGCGGGGA CCGGCCGCGA GTGGTCTTCC TGGGCGCGTT GGACGTGGTG 
ACCAACCTCG TCGGCCTCGA CTGGTTCGTC GACCGGGTCT GGCCCCAGGT TCGGGCCGCA 
GTGCCCGATG CGGTGTTCGA GGTCGTCGGC GCGCGGCCGT CCGCGGCGCT GCGGGAACGG 
CTGGGGACGG TCCCGGGCAG CGAGATCCAG GCCGACGTCC CCTCGGTCGA GCCGTACCTG 
GAGCGGGCCT GGGTCACGGT CAACCCCGCG GTGGCCGGGT CCGGGGTCAA CATCAAACTC 
GTCGAGTATC TGCAGGCCGG ACGCCCGACG GTGAGCACGT CGCTGGCCAC CCGCGGGCTC 
GACCTGCGCT CGGGCGTCGA CCTCGAGGTC CACGACGATC CGGGGGCATT CGCGCAGGCG 
GTCATCCGGC TGCTGGCCGA CCGCGAATCC GCTGCGGCGA TGGCCGCGAA CGGTCGGGCG 
ACGATCCGAC GGCTGACCGA TCCGACCCGC AACATCGCCA TGATCACCCG GGCCTTCGAA 
CAGGCCCGGT CGCCAAGAAT GAGTGAGGAA CATGACTACC AGTGA

Protein sequence

MSTEAHRWIV VADSEFLPAR DGGEREQQGL VEATLAANAL RALVIPAKQE LDLRAYRELV 
GDICVLPVHR RRSPLMLLHP RHPFVVASRP TPPGLANRLR SLVPDATGIF VLSYKSHGIG 
DRLARDLGLP MVVRQHNRES DYHRSLVEGS HGPRRLVMRW ESARIARDEA RHDRSDLVTA 
FADIAAEDAQ RRRAAGARQV MHVPPFVFGR GGADRAGALP RQAGRGDRPR VVFLGALDVV 
TNLVGLDWFV DRVWPQVRAA VPDAVFEVVG ARPSAALRER LGTVPGSEIQ ADVPSVEPYL 
ERAWVTVNPA VAGSGVNIKL VEYLQAGRPT VSTSLATRGL DLRSGVDLEV HDDPGAFAQA 
VIRLLADRES AAAMAANGRA TIRRLTDPTR NIAMITRAFE QARSPRMSEE HDYQ