Gene Namu_5252 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_5252
Symbol
ID	8450883
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	5862666
End bp	5863976
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	59%
IMG OID	645044283
Product	glycosyl transferase group 1
Protein accession	YP_003204507
Protein GI	258655351
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	57
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATTG TCTACCTGCA CCAGTACTTC AAGACGCCCC AGACAAATGG CGGAACGCGC 
TCCTACGAAA TGGCACGTAG GTGGGTGGCG CGGGGACACC GTGTCCACAT GGTGACCAGT 
GACAGCGAAC GGTCCACCGG AGGTTGGCGC ACGTACGAAG TGGAAGGGAT CACGGTGCAC 
GCGTGTGCCG TCCCCTATTC CAACGCGATG TCCTTTGGCC GCCGGATCCA GGCGTTCTTT 
CAGTTCGGAG TTCGGGCCAG CTTCCGGGCT CGTCGTTTGA AGGGGGACGT CGTCTTTGCG 
ACGAGCACCC CACTCACCAT CATCGTGCCG GCACTGTTCG CGACGGCTTT TCGGCGAACC 
CCGATGGTCT TCGAAGTGCG GGACCTCTGG CCCGATGTTC CGATTGCGCT TGGGGTTCTC 
AATAATCCAC TCATGCAACG TGCTGCACGA ACATTGGAAT GGATCGCATA CCACTCGGCC 
GACGCTGTTG TCGCGCTTTC GCCAGGAATG GCCGAGGGGA TACGGAACCG AGGGATTGGA 
GCCAGTAGAA TCGTCGTTGC GCCTAACTCC TGCGACAACG AGGATTTCAA TATCCCGAAC 
GCTATCGGCA TTGCTTATCG CGAAAGCCAG CCATGGCTCA AAGACCGACC GTTGGTGGTC 
TACTGCGGCA CTCTGGGCAA GGTCAACAAT ATTCGATATA TGGTCGATGT AGCGGCCGCT 
ACAAGACTTT TGGAGTCGAG CATCGCTTTC GCCATCTATG GCACCGGAGC AGAAGAGCAA 
CTAGTTCGGG AACGTGCAGA TTCTTTGGGC CTGCTGAACA CGACACTCTT CATGCCAGGT 
GCCGTCACCA AAAAGGAGCT GCCCGATATT CTGAGCGCGG CAGATGTATG TACGTCGTTC 
GTGCTGCCCG TAAAAGAACT CGAATACAAC AGTGCCAACA AGTTCTTCGA CGCGCTTGCC 
GCCGGGCGCC CCATGGCAGT CAATCACTAC GGCTGGCAGG CTGAGCTGCT TGAGGCCTCG 
GGGGCAGGTC TCGTGCTGGA TCCCAAGGAT CCCTACAAAG CGGCCCGCGC CTTAATCGAC 
TTCTTAAGGG ATCCGGGCCG AGTCTCGAGA GCCCGTGACG CCGCTAGGCT CCTGGCTGAT 
CAGCAGTTCG CCCGAGATCT TCTGAGCGAT CGCGTGCTTG AGACGCTGGT TGCAGTAAAG 
AGCCGCCGCC GCAAACCGAC GAAGGATCCG ACCACGGAGC GGCGCTCGCG TAAACCACGC 
CGATCGGCAA CAGGGGCGTC GCGGGACCAT GTCGCCCAGT CCAGTGCCTA A

Protein sequence

MKIVYLHQYF KTPQTNGGTR SYEMARRWVA RGHRVHMVTS DSERSTGGWR TYEVEGITVH 
ACAVPYSNAM SFGRRIQAFF QFGVRASFRA RRLKGDVVFA TSTPLTIIVP ALFATAFRRT 
PMVFEVRDLW PDVPIALGVL NNPLMQRAAR TLEWIAYHSA DAVVALSPGM AEGIRNRGIG 
ASRIVVAPNS CDNEDFNIPN AIGIAYRESQ PWLKDRPLVV YCGTLGKVNN IRYMVDVAAA 
TRLLESSIAF AIYGTGAEEQ LVRERADSLG LLNTTLFMPG AVTKKELPDI LSAADVCTSF 
VLPVKELEYN SANKFFDALA AGRPMAVNHY GWQAELLEAS GAGLVLDPKD PYKAARALID 
FLRDPGRVSR ARDAARLLAD QQFARDLLSD RVLETLVAVK SRRRKPTKDP TTERRSRKPR 
RSATGASRDH VAQSSA