Gene Namu_2233 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_2233
Symbol
ID	8447844
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	2462589
End bp	2463620
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	74%
IMG OID	645041355
Product	hypothetical protein
Protein accession	YP_003201599
Protein GI	258652443
COG category	[S] Function unknown
COG ID	[COG3595] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.000729926
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.419962
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACACCT TCCTGACCCC TGAACCGGTC ACCATCGAGA TCCGCAACTC CGCCGGCTCC 
GTCCTGATCG ACCTGGCCGA CGTCACCACC AGCACCGTCG ACGTCGTCGC CGGGCCCTCG 
CACCCGCTGG GGTTCCTGGA CGACGTCATC CGGGCGGCCA AGGCCCAGTT CGTCGGCGCC 
CGCTCGGGCG GGCCGGACGC GCACGCCGAC CACGGGTGGG GCGCCGACGT CCCCACCGAC 
GATCCCGCCG AGCGGGTCCG GGTGGATCTG CGCCCGGGCG GCTCCGAGGG CGGGGCCAGC 
ACGTTGATCG TGGACACCGA TCCCGCCCGG GACGGCTGGA AGTCCTCCTT CACCGTGCAC 
GTGACCGCCC CGGCCGGCTC CGGGGTACGG GTGCAGACGC AATCGGCCTC CGGGGTGGTG 
AACGGGATCG CCGACCGGGT CGAGGTGCGC ACCGCCTCCG GCGACGTCCG CGTCGACCAG 
GTGCTGGGTC GCTCGGTGGT GCAGACCGCC AGCGGCGACG TGACGATCTC CGACACCGCC 
GAGTGTGACG TGCGGACCGC CTCGGGTGAC ATCGAGCTGC GCCGGGTCCG GGCCGAGGCG 
CTGGTGCATT CGACCTCCGG CGACATCCGG ATCGACGCGG CCGGCCGCGA CGTCAGCGCC 
CGCAGCGTGT CGGGCGACCT GCGGTTGCTC GACGTGACCG CCGGCCGGGC CGAGCTGATC 
AGCGTCTCCG GTGACGTCGA GGTTGGCGTG CACGCCGGCA CGCTCGCCGC GATCGATCTG 
AACACCGTCT CCGGCAGCAC CGCGAACGAC TTCGTGGTCA GCGCCGCCCC GCCGGCCCCG 
GAGACGCCAA CCGTCGCCGA CGCGGCCTAC CTGGCCGATG CCGAGTTCGA CGCCGAGGGC 
GGCTCCCGCG TGAGCACCGA TGCCGGTTCG GCGGCCGGAC CGCACGCCGG GACCGACGAG 
CCGCTGCTGG ATCTGCGGGT CAAGACCACC TCCGGCGACA TCCGCCTGCA CCGCGCCGCC 
GCCTCCCACT GA

Protein sequence

MHTFLTPEPV TIEIRNSAGS VLIDLADVTT STVDVVAGPS HPLGFLDDVI RAAKAQFVGA 
RSGGPDAHAD HGWGADVPTD DPAERVRVDL RPGGSEGGAS TLIVDTDPAR DGWKSSFTVH 
VTAPAGSGVR VQTQSASGVV NGIADRVEVR TASGDVRVDQ VLGRSVVQTA SGDVTISDTA 
ECDVRTASGD IELRRVRAEA LVHSTSGDIR IDAAGRDVSA RSVSGDLRLL DVTAGRAELI 
SVSGDVEVGV HAGTLAAIDL NTVSGSTAND FVVSAAPPAP ETPTVADAAY LADAEFDAEG 
GSRVSTDAGS AAGPHAGTDE PLLDLRVKTT SGDIRLHRAA ASH