Gene Namu_3532 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3532
Symbol
ID	8449151
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	3881690
End bp	3882976
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	73%
IMG OID	645042610
Product	glycosyl transferase group 1
Protein accession	YP_003202846
Protein GI	258653690
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.00173558
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0189831
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGTTG ATTCCTCGCC CCTGGCCCCG ATCGCGGTGC CGATCACGCC GCCGGCGACG 
CTGGACCTGT CCCTGGACTC CCCGGCCGCC GAGCCCCGGC TCAAGATCGT GCTGGTCGAG 
TTCCTGCCCA GCGGCGGCAT GTTCCAGTTC ACCTTCCTGT TCGGCGAGGC GCTGGCCCGG 
CAGGGCCACG AGGTGCTGCT GCTCACCGGT CCTGACCCCG AACTGCGGTC GAACACCCCG 
GGCTTCGAGG TCGTCGAGCT CTTCCCGACC TGGCACCCCA ACGTCGATCC CGGGGGGTCG 
GCGCTGCGAC GCAAGGCCCG CCGGCTGGGC CGGGCCGCCC TGCTGGTCGA GTCGTGGCGG 
CGGGCCATCG CGTTCTTTCG CCGGGTGCAT CCCGACCTCG CCCAATTCGG CGAGCTGCGT 
TATCCGCTGG ACAGCGCGAT GCTGCTGCTG CTGGCCCGGC GCAGTCCGGA GACCGGGCTG 
GTCGACGTGG CCCACAACCC GCTGCCCTAC GACGTGAACG GCCGGGCGAC CGCGGTGGAG 
AAGACCGGGC GGCTGACCCG TTCGCTGTTG GCCGCGGCCT ACCGGGCCTG CGACCTGATC 
CTGGTGCTCG GCGAGGGCCC GCGGACCAGC CTGCTGACGG CGTTCCCGCG GCTGGGCCGG 
GTGGCCGTCT GCGGGCACGG GGACTACTCC GCGGTGCTGG CCACCGAGCA GGCACCGCCG 
CCGTCGTCGG CGCCGGCGAA TGCCCTGTTC TTCGGGGCCT GGACCAAGTA CAAGAACCTG 
CCGCTGCTGC TGGACTCCTT CGAACTGGTC CGCCTGCAGT TGCCGCAGGC CCGGTTGACC 
ATCGCCGGTC CGGTCATGCC GGACGTCGAC CTGGAATCGA TCACCCGGCG GGCCGAGCAG 
ATCGGGAACG TGGACCTACG CCCCGGGTAC GTCCCGATGG ACGAGGTCGC CGCCCTTTTT 
GCGGCTCACC GGACCGTCGT GTTCACCTAC ACGACGGTCA ACATCAGCGG CAGCGTGCAC 
ATGGCCTACA CCTTCGGCCG GCCGGTGGTG GCCACCGACG TCGGCTCGAT GCGCGACGCG 
GTCGCCGACC ACGTGACCGG CCGGCTGGCC GCGGCTGACC CGGCCGCGGT GGCCGCCGCG 
ATGGTCGAGG TCCTGGGTGA CCCGGCCGCG GCCGACCGGA TGGGCGCGCA GGCCCAGCAG 
CACGCCCGCA GCAGCGCCTC CTGGGCCTCG GTGGTCGACA AGGCGGTGCC GGCCTACCGC 
GCCGCGGTGG CCGCGGTCCG CCGCTGA

Protein sequence

MAVDSSPLAP IAVPITPPAT LDLSLDSPAA EPRLKIVLVE FLPSGGMFQF TFLFGEALAR 
QGHEVLLLTG PDPELRSNTP GFEVVELFPT WHPNVDPGGS ALRRKARRLG RAALLVESWR 
RAIAFFRRVH PDLAQFGELR YPLDSAMLLL LARRSPETGL VDVAHNPLPY DVNGRATAVE 
KTGRLTRSLL AAAYRACDLI LVLGEGPRTS LLTAFPRLGR VAVCGHGDYS AVLATEQAPP 
PSSAPANALF FGAWTKYKNL PLLLDSFELV RLQLPQARLT IAGPVMPDVD LESITRRAEQ 
IGNVDLRPGY VPMDEVAALF AAHRTVVFTY TTVNISGSVH MAYTFGRPVV ATDVGSMRDA 
VADHVTGRLA AADPAAVAAA MVEVLGDPAA ADRMGAQAQQ HARSSASWAS VVDKAVPAYR 
AAVAAVRR