Gene Namu_4202 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4202
Symbol
ID	8449828
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	4643191
End bp	4644312
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	72%
IMG OID	645043251
Product	glycosyl transferase group 1
Protein accession	YP_003203480
Protein GI	258654324
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	0.730151
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.251935
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATCCGGG TCGGCCTGGA CGGTACTCCG CTGCTCGGGC AGCGGACCGG CATCGGCCGG 
TACACCGAAC ACCTGCTCGC CGCTCTCGTT CGGCGCGGGG ACGTTACGGT GACGGCCACG 
GCCTTCACCC TTCGGGGTGC CCGTGGACTG GCCGACGCCG TTCCGGCCGG CGTCCGGGCG 
CGGTCGGTTC CTTCGCCCGC GCGGGCGTTG CGCGCTCTGT GGACGCGGTG CGAGGTGCCG 
ACGGTCCGGT CGTTCAGCGG CCCGGTCCAG GTGTTCCATG CGACCAATTT CGTGCTGCCG 
CCGACCGGGC GGGCTGGGGG CGTGGTCACC ATCCACGACC TCGCCTATCT CACCCGCCCG 
GGCACCGTCG ATGGGACTAG CCGGCAGCTG CTTGAGCTGA TGCCGCGAAG CCTGGCGCGG 
GCCGCGGTGG TGTGCACCCC GACTCATGCG GTCGCCGCCG CGGTCCGGGA CGCCTACGGG 
CCGGTGGTGC AGGACCTGGT AGTCACGCCA TTAGGCGTCG AGGCGGACTG GCTGTCCCTG 
AATCCCCCCG GGCTCGATGA GCGGGCCAGG CTCGGGCTGC CCGGCGAGTA CCTGCTGTTC 
GTCGGCACTC GGGAACCCCG CAAGGACCTT CGTACCCTGC TGGCCGCCTA TGACCGCTAC 
CGGGCGGCCG CACCGGACCC CGCCGACATT CCCGACCTGG TGTTGGTGGG GGCCCGGGGA 
TGGGGACCGG ACGAGCGTCC GGGGCCGGGT GTGCTCATTC GGGACTACAC ACCGGCCGAC 
GAGCTCAAGA CCATCGTGGC CGGAGCGCGA GCTTTGATCA TGCCGTCACG GGACGAAGGA 
TTCGGTCTCC CGGCCCTGGA GGGGTTGGCC GCCGGCGTGG CCGTGATCGT CAGCGACATC 
CCGGCCCTGA TAGAGGTCTC GGGCGGGCAT GCAGACGCCT TCCCGATGGG GGACCCGGAC 
GCCTTGGCCG ACCTGCTCGG CACGGTCACC GCCCGGGAAC GAGGGCGCAG CGACGCAGAA 
CGGGCGAGTG ACCGGCTCCG GCGCCGTCGG TACGCGGCCC GGTGGACCTG GGACCGGTGT 
GCCGAGCAGA CCATGAGCGC CTATAGGCGC GCCGCCGGCT GA

Protein sequence

MIRVGLDGTP LLGQRTGIGR YTEHLLAALV RRGDVTVTAT AFTLRGARGL ADAVPAGVRA 
RSVPSPARAL RALWTRCEVP TVRSFSGPVQ VFHATNFVLP PTGRAGGVVT IHDLAYLTRP 
GTVDGTSRQL LELMPRSLAR AAVVCTPTHA VAAAVRDAYG PVVQDLVVTP LGVEADWLSL 
NPPGLDERAR LGLPGEYLLF VGTREPRKDL RTLLAAYDRY RAAAPDPADI PDLVLVGARG 
WGPDERPGPG VLIRDYTPAD ELKTIVAGAR ALIMPSRDEG FGLPALEGLA AGVAVIVSDI 
PALIEVSGGH ADAFPMGDPD ALADLLGTVT ARERGRSDAE RASDRLRRRR YAARWTWDRC 
AEQTMSAYRR AAG