Gene Namu_3523 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3523
Symbol
ID	8449142
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	3869463
End bp	3870563
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	75%
IMG OID	645042601
Product	C4-dicarboxylate transporter/malic acid transport protein
Protein accession	YP_003202837
Protein GI	258653681
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1275] Tellurite resistance protein and related permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.00371301
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.143874
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCACCGC ACGGGCAGCC GCCGGGACCG GTCCGCCCGC CCCGGTCGCT GGACGATCCG 
GCCTGGTTCG GCGCGGTGAT GGGCCGTGCG GCCACGGCCA CCGTCGCCTC CCTGCACCCC 
GGCCGGATCG GCCCGCTCAG CCGCTTCGCC GACGTCACCG CCGCGATCCT GCTCGTGGCC 
AGCATCCTCG CCTTCGCCGG GCTGTTCGTG CGCGACTTCC TGGTCCGCCG CCTGGGCGCC 
GACCTGGCCG GCAAGCTCCG CTCGCCCCGC ACCGGACCGG CCTACGCCAC CATCCCCGGC 
GCGATCAACG TGCTCGCCGT CGCCGTCCTG CACGTGTGGC CGGCCAGTGC CAACTCGGCG 
GTCGGCTGGT GGCTGCTCAT CGGGCTGGCC GGCCTGGGCA CCACGCTGGG CCTGATGCTG 
ACGGTGGTCT TCTTCGTCAG CGCGTTCGAG CACGAACAGT TTCCGGCGCA GGACATCTCG 
GGCATCTGGT TCATTCCGGA GACCGTGGTC CTGCTGGGTT CGTTGCTGTT CGCCGAGCTG 
GCGCCGGCCG GACCGGAGGC CGCTCAGCGC GGGCTGGCCG TGCTGGCGGT CGCCCTGCTC 
GGGGCCGGCG GGTTGCTGTT CGGGATCACC GCGGTGATCT TCGTGAACCG GCTGGTGCTG 
CACGCCGGGG TGCACCGCAC CGGCGCCCCG GCCATGTGGA TCATGATCAG CCCGCTGGCC 
GTCACCTCGC TCGCACTCCA GTCGGTGGCC GGCGGCGACC CGATGCTTGG CGGGACCTGG 
ACGCCGGCCG TGGCCGAGGT CGCCACCTTC GCGGCCGGCG CGCTCTGGGG GTTCGCCCTC 
TGGTGGATCG CCGCTGCCGC CGTGGTCACC CGGCACGCCG GGCGGGCCGC GTTCACCCGG 
ACCGCGGCGG ACTGGGGCTT CGTCTTCCCG TCCGCGGCGA TGGTCATCGC CACCCTGACC 
CTGGCCCGGC GATGGCAGTC CGGCCTGGTC GAGGCGGCCG GCCTGGCTCT GGGCGTGCTG 
CTGGCCCTGG TCTGGGTGGC CGTGCTGTCC GGCGCCGTCG TCGGGTACCG GCGCGAGCAA 
CGCACCCGCC GCGGCCGGTG A

Protein sequence

MAPHGQPPGP VRPPRSLDDP AWFGAVMGRA ATATVASLHP GRIGPLSRFA DVTAAILLVA 
SILAFAGLFV RDFLVRRLGA DLAGKLRSPR TGPAYATIPG AINVLAVAVL HVWPASANSA 
VGWWLLIGLA GLGTTLGLML TVVFFVSAFE HEQFPAQDIS GIWFIPETVV LLGSLLFAEL 
APAGPEAAQR GLAVLAVALL GAGGLLFGIT AVIFVNRLVL HAGVHRTGAP AMWIMISPLA 
VTSLALQSVA GGDPMLGGTW TPAVAEVATF AAGALWGFAL WWIAAAAVVT RHAGRAAFTR 
TAADWGFVFP SAAMVIATLT LARRWQSGLV EAAGLALGVL LALVWVAVLS GAVVGYRREQ 
RTRRGR