Gene Namu_4001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4001
Symbol
ID	8449620
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	4418210
End bp	4419409
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	75%
IMG OID	645043046
Product	hypothetical protein
Protein accession	YP_003203282
Protein GI	258654126
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0000201324
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.340797
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGTCAC GCCACGGCTC GGGGTCCGGC GGGGCACGCA TCGCCCCGTG GATCATCGTC 
GCCGTCGTCA GCGTCGTCGT GATCGCCGGC GCGGTGACCG CCTACGTCTT CATCACCCGG 
GACAACAAGG CCGCCGCCAC CTGTACCAGC CAGGTCGTGC TCGAGGTCGT GGCCGCCCCC 
GGCGCGGCGC CGGCCATCGA GGCCGCGGCC GCCGCGTTCG ACGCCACCAA TCCGGTCGCC 
CGATCGGCCT GCGTCACCAC CGACGTGACC GCGGCGCCCG GGTCGCAGAC CGCCAGCGAC 
CTGGCCGACG GGTGGACCGC CCAGCCGAGC CAGGGGCCGG CGCTGTGGTT CCCGGACAGC 
GCCGCCGATC TGGCCACCCT GGAGACCCAG GACTCGGCGA TGACAGCCGG CCGCAACCCG 
GCGCCGATGG CCGCGTCACC GGTCGTGCTG GCCGTGCGCA GCACGGACGC GGCCGCGGTG 
ACCGCCGCCA ACCTGCAGTG GAAGGACCTG ATCACCGCCG CCGGACCCAC CGGATCGGTG 
ACCCTGCCCG ACGGCGGCAA GCTGATCCTG GCCTTGCCCG ATCCCACCAC CAACCGCGCC 
ACCAGTGACG CGCTGCAGTC GGTCCTGGCC GGGACGACGT CGGCGACCAT CGACCCGTCG 
GTGGTCGCGG CGAACGCCCC CGCCCTGGCC GGGCTGGCCG CCGGTGGGCC AGCCGTCCCG 
CCGGCCACCA CCCTGGACGC GTTGGCCGAC CTGCAGGCCG GCAACGCAGG TTTCGCCGCC 
GTGCCGATCG TGGCGTCCGA GTTCGCCCAA CTGGCCGAGC AGAATCCCGG GTTGACCACG 
GTGAGCCTGG GCGGTCCGAC CGGAGGTGAC CAGATCTTCG GCGTGCCGAT CACCGCCAGC 
TGGGTCAACC CGACCATGGA CGACGCGGCC AGCGCGTTCC TGGCCTACCT GCGAGGACCG 
GCCGGAGCGC AGGTGCTGAC CGACCAGGAT CTGGCCGCCG CCTCCGCCGT CTCCCTGGCC 
GATGCCGGGG CGTCGGTCGA CGCGGCCCTG GCCAGCGCCA TCGGCAGCCC CGGCGCGACC 
GGCGCCGCGC CCACCGCCGA CGGCACCGCG CCCGCGACGG CAACCCCGGG GCCGTCCGGT 
GCCCCGACCT CGGGCGCATC CACCCCCACC ACGACCACGA CCACGACCAC GGGATCCTGA

Protein sequence

MTSRHGSGSG GARIAPWIIV AVVSVVVIAG AVTAYVFITR DNKAAATCTS QVVLEVVAAP 
GAAPAIEAAA AAFDATNPVA RSACVTTDVT AAPGSQTASD LADGWTAQPS QGPALWFPDS 
AADLATLETQ DSAMTAGRNP APMAASPVVL AVRSTDAAAV TAANLQWKDL ITAAGPTGSV 
TLPDGGKLIL ALPDPTTNRA TSDALQSVLA GTTSATIDPS VVAANAPALA GLAAGGPAVP 
PATTLDALAD LQAGNAGFAA VPIVASEFAQ LAEQNPGLTT VSLGGPTGGD QIFGVPITAS 
WVNPTMDDAA SAFLAYLRGP AGAQVLTDQD LAAASAVSLA DAGASVDAAL ASAIGSPGAT 
GAAPTADGTA PATATPGPSG APTSGASTPT TTTTTTTGS