Gene Namu_4557 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4557
Symbol
ID	8450185
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	5071771
End bp	5072970
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	72%
IMG OID	645043598
Product	Transglycosylase domain protein
Protein accession	YP_003203825
Protein GI	258654669
COG category	[S] Function unknown
COG ID	[COG3583] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCTTAC AAATAGACAA CGTTGACGCC CCGTCCGGGC CGAACGAGCA GCCGGCCCGC 
CGGGGCCTGC GCCGCAAGCT GGTGCTGGTC GGCGTGGCCG CCGCGCTCGG TGTCGTGGCT 
GTCGGTGGCG CCACCGCCGC CGCCATGTCC AAGCACGTCG TCATCACCGT CGACGGCCAG 
GACCAGCAGG TCACCACGCT GTCCGGCTCG GTGGCCGGTG CGCTGTCCGC CGCGGGCCTG 
TCCGCCGGTG AGCACGACGT GCTCGCGCCG GCCGCCGACA CCGCCATCTC CGACGGTTCG 
CACATCGCCC TGGAGCGCGC GCGGCTGTTG ACCCTGACGG TCAACGGGAC CACGCAGCAG 
CTGTGGACGA CCGCCGACAC CGTCGAGGAG GCCCTGCTGC AGCTCGGCCA GGATCCGTCG 
GCCTACCAGC TGTCCGCGGA CCGGTCCCGG GAGATCCCGC TGGACGGTCT GGACCTGACC 
GCCTCCACCC TGCACACCGT CAGCCTGGCC GTCGGCGGGG CTCCGGCCAC CACCGTCCAG 
TCCGGCGGAC AGACCGTCGC CGACGTGCTG GCCGCCCAGG GCATCACCCT GGCCGCGACC 
GACACCGTCG ACCCGGCCGG CACCACCCCG GTCACCGACG GCACCGCGAT CACCGTGACC 
CGGGTCGCCG TCACCACCAC CACCGACACC GTCGCGGTCG CGCCGGCCGA CCAGACCGTC 
GAGGATCCCA ACCTGGACAA GGGCACCACC CAGGTCGTCG CCGCGGGTAC CCCCGGCCAG 
CAGCAGGTCG TCACCCAGGT CACCACCACC AACGGGGTGG AGACCGGCCG TCAGGAGCTG 
TCCCGCACCA CGGTGCTCGA GGCCACCCCC AACCAGGTGC ATGTCGGCAC CAAGTCCACC 
CTGGACTGGC AGGGCAGCCG GGTGTTCTTC CACGACACCG AGTTCGGCGT GAACTGGGAC 
GGTCTGGCCT ACTGCGAGTC GACCAACAAC CCGCACGCGG TCAACAACCC GGCCGGCTAC 
CTGTCGACCT ACGGCCTGTT CCAGTTCGAC CTGCCCACCT GGGCCTCGGT CGGCGGCTCG 
GGCAACCCCG GGGATGCCTC CCCGGAGGAG CAGTTGACGC GGGCCAAGTT GCTCTACCAG 
TCCCGTGGGC TGGAGCCGTG GCTCTGCGGC TACGCCGCCA GCGGCCCGCC CGCCGGCTGA

Protein sequence

MTLQIDNVDA PSGPNEQPAR RGLRRKLVLV GVAAALGVVA VGGATAAAMS KHVVITVDGQ 
DQQVTTLSGS VAGALSAAGL SAGEHDVLAP AADTAISDGS HIALERARLL TLTVNGTTQQ 
LWTTADTVEE ALLQLGQDPS AYQLSADRSR EIPLDGLDLT ASTLHTVSLA VGGAPATTVQ 
SGGQTVADVL AAQGITLAAT DTVDPAGTTP VTDGTAITVT RVAVTTTTDT VAVAPADQTV 
EDPNLDKGTT QVVAAGTPGQ QQVVTQVTTT NGVETGRQEL SRTTVLEATP NQVHVGTKST 
LDWQGSRVFF HDTEFGVNWD GLAYCESTNN PHAVNNPAGY LSTYGLFQFD LPTWASVGGS 
GNPGDASPEE QLTRAKLLYQ SRGLEPWLCG YAASGPPAG