Gene Namu_4449 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4449
Symbol
ID	8450076
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	4935962
End bp	4937380
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	65%
IMG OID	645043496
Product	capsular exopolysaccharide family
Protein accession	YP_003203724
Protein GI	258654568
COG category	[D] Cell cycle control, cell division, chromosome partitioning [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0489] ATPases involved in chromosome partitioning [COG3944] Capsular polysaccharide biosynthesis protein
TIGRFAM ID	[TIGR01007] capsular exopolysaccharide family

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAATTGC GTCAGTACGG GCGAGCGCTG CGCAAGGGGT GGTGGATCAT CCTCTTGTGT 
GCCGCGCTCG GCGTCGGCGC TGCCGCCCTG GTCACGCTCC GGGCGACTCC GCAGTACGCG 
AGCTCCGTCA CCTGGTTCGT CAGCACGCCC GCCGGGAATG GCACCTCTGC GTTGGCGGCC 
GATCAGTTCG CCACCCGCCG CATCACCTCT TACGTGGGGC TGCTGGGCAG TGACGTCACG 
GCTCAGGCGG TCATCGACAA GACCGGGGTC GACCTGGACA CCAGCCAGGT GGCGTCGCGC 
ATCTCCGGCG ACGCCGATCT GAACACGGTG TTGCTCACCG CCACCGTCGT CGATTCCTCG 
CCTGAACGAT CGCTGCTCAT CGCACAGGGT CTGGCGACGG AGTTCGGCAA AATCGTCGGC 
GACGTCGATC CGATCGGACC GGACAATGTC GTTCTCCGGG TCATTTCCGG CCCAACCTTG 
AACCCGCAAG CGGTATCGCC CCGGCGGACA TTCAACCTGG CCGTCGGCCT GGGCCTCGGT 
GTGGTGTTGG GGGTCGTCAT CGCGGTCACC CGGGAATTGC TCGACAACAC CGTCCGTCAG 
GTCTCGGTGT TGCACGACGT GACGGGCGAG ACGGTCCTGG GCGCCATTCC ATTCGACAAA 
TCAGCCCGAC GATCCCCCTT GATTCAGCAG GACAATGCTC GTTCGATTCG AGCCGAGGCA 
TTTCGACAAC TGCGGACCAA CCTGCAGTTC TTCGATGTGG ACCGACCGGT CCAGGTCCTG 
GTCGTGACCT CGTCGGTCCC CCATGAAGCC AAGTCCACCA CGGCCACCAA CCTGGCCGTG 
TCGTTCGCCG AGTCCGGTCG CCGGGTCCTG TTGATCGAGG CCGACCTCAG GCGACCCAAG 
GTGGCGGACT ACCTCGGTGT GGAGCGCGCG ATCGGGCTGA CCAGCGTCCT GTCCGGTGCT 
GCCTCGATCG AGGACGCCAT TCAGGAATGG GGGCCCGGTG GGCTGTCCGT GCTCGGCAGC 
GGTCCGATCC CGCCCAACCC GGCCGAGTTG CTCGGCAGCG TGGCCATGTC GACGCTGATT 
CGTGCGCTCC GCCAGGATTT CGACATCGTC GTCATCGACA CGCCCCCGCT CCTGCCGGTC 
ACGGACGCGG CCGTGGCGTC CAAGCAGGCA GACGGATGTC TGCTGGTGGT GCGGTACGGG 
AAGACGAAGC GGAGCCAGAT CCTTAGCGCG CTCAGATCGC TGCGATCGGT CGACTCGCGC 
ATCCTCGGCA TCGTTCTCAA CATGGTGCCG GCCAACGGCT CGGATGGGTA CGACTCGTAT 
CAAGGCACCT ATTACGCAGA CCCCGATAAG GCTGGGGACG GGGACGTGGA GGGAACGGTC 
GCTTCATCGG CGCCGGCATT CAAGTCCAAG GTGCAGTGA

Protein sequence

MELRQYGRAL RKGWWIILLC AALGVGAAAL VTLRATPQYA SSVTWFVSTP AGNGTSALAA 
DQFATRRITS YVGLLGSDVT AQAVIDKTGV DLDTSQVASR ISGDADLNTV LLTATVVDSS 
PERSLLIAQG LATEFGKIVG DVDPIGPDNV VLRVISGPTL NPQAVSPRRT FNLAVGLGLG 
VVLGVVIAVT RELLDNTVRQ VSVLHDVTGE TVLGAIPFDK SARRSPLIQQ DNARSIRAEA 
FRQLRTNLQF FDVDRPVQVL VVTSSVPHEA KSTTATNLAV SFAESGRRVL LIEADLRRPK 
VADYLGVERA IGLTSVLSGA ASIEDAIQEW GPGGLSVLGS GPIPPNPAEL LGSVAMSTLI 
RALRQDFDIV VIDTPPLLPV TDAAVASKQA DGCLLVVRYG KTKRSQILSA LRSLRSVDSR 
ILGIVLNMVP ANGSDGYDSY QGTYYADPDK AGDGDVEGTV ASSAPAFKSK VQ