Gene Namu_5245 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_5245
Symbol
ID	8450876
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	5851644
End bp	5853731
Gene Length	2088 bp
Protein Length	695 aa
Translation table	11
GC content	74%
IMG OID	645044276
Product	protein of unknown function DUF477
Protein accession	YP_003204500
Protein GI	258655344
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	54
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCATCG GACGAGGACT GCACCGGGCC GCGGCGGGGC TCGCGGTCGT CACGATCATT 
GGGTTGACCG CACCACCCGC CAGCGCCGAA CCTCCGTTCC GGCTGCCCAA CCAGATCACC 
GACCAGGTCG GGGCCCTCAC CGGGTCCGAC CGCACCGACG TGCAGACGGC CCTGGACCAG 
CTCTCGGCCG AGGAGAACAT CGACCTGTAC GTGGTCTACG TCGATACCTT CGACGAGCCG 
AGCGCGGCCG TCGACTGGGC CGCCCAGACC TGGCAGACCT CCGACCTGGG CGCCAATCAG 
ATGCTGCTGG CCGTGGCCAC CGGTGGTCGG GCCTATGCGG TGCACGTGCC GAACAACTTC 
AAGATCTCCG ACGCCCAGCT GCAGCAGGTC GCGACCACGC AGATCCAGCC CGAGCTGCGC 
AACGACGACT GGGCCGGCGC GGCCATCGCC GCCGCCAACG GCTACCGGGA CGCACTGGGC 
GGCGGCTCCT CGACCGTCTG GTGGTGGATC GCCGGCGCCA TCGTGGTCGT CGGGGCCGGC 
GGGTACCTGA TCTACCGGCG CCGAGCCAAG GCCGGCGCCG GCTCCGGGCC AGCCGGTCCG 
GCGGGTGCCC CGGGGCAGCC CGCGGAGCCG CTCGAGCCGT TGGAGGCCCT GTCGGCGCGC 
AGCGTGCAGG TCCTCATCGA CACCGACAAT GCCGTGCGGG CCAGCGAATT CGAGCTCAGC 
GCAGCCGAGA GCGACTTCGG CCACGACGCC GTCGCGCAGT TTCGGGTCGC GTTCGACTCG 
GCCCGCGAGT CGCTCACTCA GGCCTTCGAA ATCCGGCAGA AGGTTGACGA CGACCAGCCC 
GAGGACGACG CCACCAAACG CGCCATGATG AACGACATCA TCGACCGGTG CGCCCAGGCC 
TCGGCGACGC TGGACGCGCA GAGCGATCGC TTCGACGAGC TGCGGGGGCT GCGATCCCGG 
CTGCCGCAGG TGCTGGCCGA GCTGCCCGGC ACGATCGACT CCCTGCAGGC GCGGATGCCG 
GCTGCCGCAT CGACCCTGCA GCGGCTGCAG CAGCAGTTCT CGCCGACCGC ACTGGCCACC 
GTGGCGGCCA ACGTCGAGCA GGCCGGTGAG CGGTTGCAGT TCGCCCGGGT CAGCCTGGAC 
CAGGCGCGCC AACAGGCGGC CGGATCGACC CCGGCCACCA GCACCCTGCC GCTGCCCGGT 
CAGCCGCCGG CGACGGCCAC GCCCCCGGCG GCCGCGGTGT TGGCCGCCGG TGCGGCTCAG 
GAGGCGGCCG ACCAGGCCCG GACCCTGCTG GACGCCATCG ACCGGATGGC CGCCGATCTG 
GCCACCGCGA CCACGCAGCT GACCGGCGCG ATCAGCGCGG TCGATCAGGA GCTGGCCGCG 
GTCCGGGCGG CGCTCGATTC CGCGACCGCC GGGGCCAACG AGGCCTCGAT CCGGGCTCAG 
CTCGACCAGA TTCAGGCCAT CCTGTCGGTC GCCCGTTCCC CCCAAGGCGC GGCCGACCCG 
ATGACCGCCC TGCACAAGGT CGAAGAGGCC GACCTCGCTC TGGACGGCAT CCTGGCCAGC 
ACCCGCAGCG CCCAGCAACA GGAGCAGCGC AGCCAGGCGG CGCTGGGCCA GGCGCTGCCG 
ACCGCCCGGG CCGAGGTGGC GGCGGCCGAG GACTTCGTGA ACACCCGCCG CGGCGCGGTC 
GGGAGCCAGG CCCGCACCCG GCTGGCCGAG GCGAAGCGGC ACCTCGCCAA TGCCGAAGCC 
GGCACCGGCG GCGCCGCGGC CGCGGCGTCC GAGGCCCAGC AAGCGGCCGC CCTGGCCCGG 
GAGGCCGCCG ATCTGGCCCA GCGAGACGTG AACGGCTTCG GGGGTGGCGG TTTCGGCGGT 
GGGCAGCGCG GCGGCAACAG CGGGCTGGCC GGCGCCGTCC TTGGCGGCAT CGTGCTGGAC 
GCCGTGCTCA ACTCGGGCCG ACGCGGTCGT GGGGGCGGCG GCTGGGGCGG GGGCTTCGGT 
GGCGGCGGCT ACCGTGGTGG CGGCGGTGGT TTCGGCGGTG GCGGCGGTGG TTTCGGCGGC 
GGCGGTGGCG CCGGGTCCGG GCACAGTGGG GGCAGCGGCC GCTTCTGA

Protein sequence

MRIGRGLHRA AAGLAVVTII GLTAPPASAE PPFRLPNQIT DQVGALTGSD RTDVQTALDQ 
LSAEENIDLY VVYVDTFDEP SAAVDWAAQT WQTSDLGANQ MLLAVATGGR AYAVHVPNNF 
KISDAQLQQV ATTQIQPELR NDDWAGAAIA AANGYRDALG GGSSTVWWWI AGAIVVVGAG 
GYLIYRRRAK AGAGSGPAGP AGAPGQPAEP LEPLEALSAR SVQVLIDTDN AVRASEFELS 
AAESDFGHDA VAQFRVAFDS ARESLTQAFE IRQKVDDDQP EDDATKRAMM NDIIDRCAQA 
SATLDAQSDR FDELRGLRSR LPQVLAELPG TIDSLQARMP AAASTLQRLQ QQFSPTALAT 
VAANVEQAGE RLQFARVSLD QARQQAAGST PATSTLPLPG QPPATATPPA AAVLAAGAAQ 
EAADQARTLL DAIDRMAADL ATATTQLTGA ISAVDQELAA VRAALDSATA GANEASIRAQ 
LDQIQAILSV ARSPQGAADP MTALHKVEEA DLALDGILAS TRSAQQQEQR SQAALGQALP 
TARAEVAAAE DFVNTRRGAV GSQARTRLAE AKRHLANAEA GTGGAAAAAS EAQQAAALAR 
EAADLAQRDV NGFGGGGFGG GQRGGNSGLA GAVLGGIVLD AVLNSGRRGR GGGGWGGGFG 
GGGYRGGGGG FGGGGGGFGG GGGAGSGHSG GSGRF