Gene Namu_3156 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3156
Symbol
ID	8448770
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	3477739
End bp	3479271
Gene Length	1533 bp
Protein Length	510 aa
Translation table	11
GC content	78%
IMG OID	645042237
Product	UMUC domain protein DNA-repair protein
Protein accession	YP_003202478
Protein GI	258653322
COG category	[L] Replication, recombination and repair
COG ID	[COG0389] Nucleotidyltransferase/DNA polymerase involved in DNA repair
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0000974062
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.000679979
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCCGGA CCATCGTCGT CTGGTGCCCG GACTGGCCAG CGGTGGCGGC CGCCCGGCAG 
GCGAACCGGC CGGCCAGCGA CCCGGTGGCG GTGCTGCACG CCAACCGGGT GCGGGCCTGC 
ACCGCCGCCG CCCGGGCGCA GGGGGTGCAC GTCGGCCAGC GGCGCCGCGA CGCCCAGTCC 
CGCTGCCCGG ACCTGCTGAT CACCGGCGTC GACCAGGACC GGGACGCCCG GATGTTCGAG 
CCGGTGGCCG CGGCGGTGGA GTCCCTGGCC CCCGGGGTGG AGGTGCTGCG CTGCGGAGTG 
GTGGCCTGTC CGGCCCGCGG ACCGGCCCGC TACTTCGGCT CGGAGGCCGC CGCCGCGGAA 
CGGATCGTGG ACGCGGTCGA GGCGCTGGAC GTCGAGTGCT GCATCGGGAT CGCCGACGAC 
CTGGAGATCG CGGTGCTGGC CGCCCACCGG TCGGTGCTGG TCCCGCCGGG GGAGTCGGCC 
GCCTTCTGCG CCGGGCTGCC GATCACCGAC CTGTCCCGGG ACCCGGCGAT CGGCCCGCCC 
GACCGGGTCG CGCTCACCGA CCTGCTGATC CGCCTGGGCA TCACCACCGC CGGGGCATTC 
GCGGCGCTCC CACCGGAAAA GGTGGCCACC CGGTTCGGCG CCGACGGGGT GTGCGCGCAC 
CGGTTGGCCC TGGGCCGGCC CGAGCGCGGC CTGTCCCGCC GGCAGATCCC CGAGGATCTG 
GTCGTCGAGC AGGAGTGCGA CCCGCCGCTG GACCGGGTGG ACACCGCCGC CTTCGCCGCC 
CGGGCCCTGG CCGAGCGGTT CCACGCGCGG CTCGCCGACG CCGGCCTGGC CTGCACCCGG 
CTGGTCATCA CCGCCGCCAC CGACCGGGGC GCCACTCTGT CCCGCACCTG GCGCTGCGCC 
GCGCCGCTGA CCGCCGCGGC CACCGCGGAC CGGCTGCGCT GGCAGCTGGA CGGCTGGCTC 
ACCCACCGTC AGCAGCCCGG CGCGATCACC CGGCTCGCCC TGGAACCGGT CGAGGCGGTC 
GGCTCCGGGC ACATCCAGTA CGGGTTGTGG GGCTCCGACG GGCAGGACGA CCAGCGGGCC 
GGCTGGGCCT TCGCCCGGGT ACAGGGCCTG CTGGGGCCCG ATTCGGTGCT GTCCCCGGTG 
CCGGCCGGCG GCCGGAGCAC CGCGGACCGG GTGGTGCTGG TGCCCTGGGG GGACGAGAAG 
GTGAGCCCCC GGGACCCGGC CGCGCCCTGG CCCGGGGCGA TCCCGTCCCC CTCGCCGGCC 
CGGGTGAGCG ATACCGAGCC GATCGCCGTG CTGGACGCCG CCGGTGACCC GGTGCGGCTC 
ACCGACCGCG GCCGGCTGAC CGGCCCGCCG GCCTGGCTCA GCGGCACCCG CATCGACGCC 
TGGGCCGGGC CCTGGCTGCT GGACGAGCAC TGGTGGGCCT CGGGCCGGGA CATCGTGCCC 
ACCGCCCGGT TGCAGCTGGT CACCGCCGCC GGCGCGGCGC TGCTGGTGCG TTCGGCCGGG 
GACGGCTGGC AGGTCGAGGG GACGTACGAC TGA

Protein sequence

MSRTIVVWCP DWPAVAAARQ ANRPASDPVA VLHANRVRAC TAAARAQGVH VGQRRRDAQS 
RCPDLLITGV DQDRDARMFE PVAAAVESLA PGVEVLRCGV VACPARGPAR YFGSEAAAAE 
RIVDAVEALD VECCIGIADD LEIAVLAAHR SVLVPPGESA AFCAGLPITD LSRDPAIGPP 
DRVALTDLLI RLGITTAGAF AALPPEKVAT RFGADGVCAH RLALGRPERG LSRRQIPEDL 
VVEQECDPPL DRVDTAAFAA RALAERFHAR LADAGLACTR LVITAATDRG ATLSRTWRCA 
APLTAAATAD RLRWQLDGWL THRQQPGAIT RLALEPVEAV GSGHIQYGLW GSDGQDDQRA 
GWAFARVQGL LGPDSVLSPV PAGGRSTADR VVLVPWGDEK VSPRDPAAPW PGAIPSPSPA 
RVSDTEPIAV LDAAGDPVRL TDRGRLTGPP AWLSGTRIDA WAGPWLLDEH WWASGRDIVP 
TARLQLVTAA GAALLVRSAG DGWQVEGTYD