Gene Namu_0503 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_0503
Symbol
ID	8446086
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	557192
End bp	558442
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	70%
IMG OID	645039639
Product	protein of unknown function UPF0118
Protein accession	YP_003199911
Protein GI	258650755
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	45
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCGGAC GACGCTCACC GGGAGCAGGC CGGGCCGTCG CCGCCGATCC CGACTCCCGG 
ACCGGTGCCG ATGGCGGTAC CGATGCCGAC GACCTGGCCG GTCATCGCCC CACCGGACCG 
GTCAGCACCG CCTCCGCGCG CCGGTTGGAA CGCGGGCTCG TGGAGTACTC GCAGTGGACG 
CTGCGCCTGC TGATCATCGG CGTGGGGTTG TTCGCCGCGT TCTGGATCCT GGGCCAGCTC 
TGGAGTGTGG TCCTGCCGAT CCTGCTCGGC CTGCTGCTGG CCACCATCCT GTGGCCGCCG 
GTCCGGTTCA TGCGGCGCAA GCTGCCCAAT GCCCTGGCCG CGATCGTGGC CCTGATCGGC 
CTGCTGGTGA TCTTCAGCGG GTTGATCGCG GTGCTGGCTC CCCAGGTGAC CTCGCAGGCC 
GGCGAGCTGG TCGATCGGGC CACCGCCGGC CTGACCACCC TGCAGAGCTG GCTGGCCGGT 
CCCCCGTTCA ACCTGGGCCC GGACGCGCTG GGCGGGCTGC TGGACAAGGG CATTTCCGAG 
ATCCAGAGCA ACAGCCAGGA AGTGCTCGGG GTGGTGCTGG GCAGCCTGTC CGCCATCGGC 
TCGGCCGTGA TCACCCTCGT CCTGGCCCTG GTGCTGTGCT TCTTCTTCCT CAAGGACGGC 
CCCAAGTTCG TGCCGTGGCT GCGGACCTGG ATCGGTCGCG CCGCCGGCAC CCACTTCGCC 
GAGCTGTCCG ACCGGGTGTG GACCGCCCTG GGCCAGTACG TCTGGTCGCA GGCGGCGGTC 
GCCGCGGTCG ACGGCGTCTT CATCGGCGTC GGAGTGTGGT TGCTCGGCGT GCCGTTCGCC 
CTGCCCATTG CGGTGCTCAC CTTCTTCGGC GGGTTCGTGC CGATCGTCGG TGCGTTCGTC 
GCCGGGTCGG TCGCCGTCCT GGTCGCGCTG GTCTCCAACG GCATCTGGAC CGCCGTGGGC 
GTGCTGGCGA TCGTGCTGGT CGTCCAGCAG CTCGAGGGCA ACGTGATGCA GCCGATCCTG 
GTCGGCAAGA CGATGAACAT CCACGCCGCG GTGACCATCG CCGTGGTCGC CCTGGGCGGC 
ACCCTGTTCG GCATCGTCGG GGCGTTCCTG GCCGTCCCGG CGGTGGCCGT GGTTCAGGTG 
ATCGCCCGGT ACACCCGCGA GCAGCTGCAG GAGGCGCCCG ATTCCGCGCG CGATTCCGCG 
CCCAATTCCG CGCCCAATTC CGGACCCACG CCCGATCCCG ACCCGGCCTG A

Protein sequence

MFGRRSPGAG RAVAADPDSR TGADGGTDAD DLAGHRPTGP VSTASARRLE RGLVEYSQWT 
LRLLIIGVGL FAAFWILGQL WSVVLPILLG LLLATILWPP VRFMRRKLPN ALAAIVALIG 
LLVIFSGLIA VLAPQVTSQA GELVDRATAG LTTLQSWLAG PPFNLGPDAL GGLLDKGISE 
IQSNSQEVLG VVLGSLSAIG SAVITLVLAL VLCFFFLKDG PKFVPWLRTW IGRAAGTHFA 
ELSDRVWTAL GQYVWSQAAV AAVDGVFIGV GVWLLGVPFA LPIAVLTFFG GFVPIVGAFV 
AGSVAVLVAL VSNGIWTAVG VLAIVLVVQQ LEGNVMQPIL VGKTMNIHAA VTIAVVALGG 
TLFGIVGAFL AVPAVAVVQV IARYTREQLQ EAPDSARDSA PNSAPNSGPT PDPDPA