Gene Namu_3444 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3444
Symbol
ID	8449059
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	3787285
End bp	3789012
Gene Length	1728 bp
Protein Length	575 aa
Translation table	11
GC content	71%
IMG OID	645042520
Product	sulfate transporter
Protein accession	YP_003202760
Protein GI	258653604
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0659] Sulfate permease and related transporters (MFS superfamily)
TIGRFAM ID	[TIGR00815] high affinity sulphate transporter 1

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0027476
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.000776053
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGGGCGCCG TCACTGCCAT CGAACGCGCC GTCCCCGGCG TCGGGATGTT GCGCACCTAC 
CGGCCGGCCT GGCTGGGCAA GGACGTCACC GCCGGCCTGG TGCTCACCGC GCTGCTGGTG 
CCGCAGGGCA TGGCCTACGC CGAACTGGCT GGGCTGCCGC CGATCACCGG CCTATACACG 
ACCGTGCTGT GCCTGCTCGG GTACGCGGCG TTCGGCCCGT CCAAGGTGCT GGTGCTCGGG 
CCCGATTCCT CGCTGGGGCC GATGATCGCG GCCACCGTCA TCCCGCTGGT CACGGCCAAC 
GGCGACCCCG GCAAGGCGGT GGCCTACGCC TCGATGCTGG CCCTGATGGT CGGCGCGATC 
ACCATCGCCG CGGGCGCCTT CCGGCTCGGC TTCATCGCCG ACCTGCTGTC CAAGCCGACG 
CAGGTCGGGT ACATGAACGG CCTGGCCCTG ACCATCGTCA TCGGGCAGCT CCCCAAGCTG 
TTCGGCTTCT CGGTGGATGG GGACGGGCTG ATCGAGGAGG CGACCGAGTT CGTCCGCGGG 
GTCGCCGATG GGCGGACCGT GCCGGCCGCG CTGGCCATCG GGGTGGGCTC GCTGGCGGTC 
ATCCTGCTGC TCAACCGGTT CCTGCCGCGC ATCCCCGGGG TGCTGGTCGC GGTGGTGCTG 
GCGATCGCCG CGGTGGCCGT GTTCGACCTG GCCGCGCGCG GGGTCAAGCT CGTCGGCACG 
CTGCCCGAAG GCTTCCCGCC GCTGACCATC CCGACGGTGC CGCTGACCGA TCTGGGGCTG 
CTGTTCGCCG GGGCACTGGG CATCGCGCTG GTCTCGCTGA CCGACACCAT CTCCACGGCC 
AGCGCGTTCG CCGGCCGGCG CGGCGAGGAC GTCAACGGCA ACCGGGAGAT GATCGGCATC 
GGCGCCGCCA ACATCGCGGC CGGCCTGTTC CAGGGGTTCC CGGTGTCCAC CAGCGGCTCG 
CGGACCGCGG TGGCCGAGCA GAACGGGGCC CGCTCGCAGG TCACCGGCCT GGTCGGCGCG 
GGGGCGGTGA CGCTGATGCT GGTGTTCTTC CCCGGGCTGC TGCGCAACCT GCCGCAGCCC 
ACCCTGGCCG CCATCGTCAT CGCCGCGTCG ATCTCACTGG CCGACCTGCC GGCCCTGCGC 
CGGCTGTGGC GGCAGCGCAA GTCGGACTTC GCGCTGGCCA TGGCCGCGTT CCTGGGGGTG 
GCACTGCTCG GCGTGCTGCC CGGCATCGCG ATCGCCGTGG CCCTGTCGGT GCTCAACGTG 
TTCAGCCGGG TCTGGCGTCC CTACCGGACC ATGCTGGGCA AGGTCGAGGA CCTCAAGGGC 
TACCACGACA TCCGGCGCTA CCCCGCCGCG GATGCGCTGC CCGGGCTGGT GCTGTACCGG 
TTCGACGGGC CGCTCATCTT CGCCAACGCC AACACCTTCC GCGACGACCT GCGCCGGTTC 
GCCGAGGCGA CTCCCCCGCC GCGGTGGATC GTGGTGACCG CCGAGCCGAT CACCGACGTG 
GACACCACCG CCGCGGACAT GCTGGTCGAG CTGGACCTGT GGCTCAACGC GCGCGGGATC 
AACCTGGTGT TCGCCGAGAT GAAGGACCCC GTGAAGACCA AGATCGAGCG CTACGAGCTG 
ACCGACACGA TCGACCCGAA CCACTTCTTC CCGACGATCG GGTCGGCCGT GCGCGCGTAC 
CGGGACATAA CCGGCCTGGA CTGGCCGGAC CGCGATCTGC CCGACTGA

Protein sequence

MGAVTAIERA VPGVGMLRTY RPAWLGKDVT AGLVLTALLV PQGMAYAELA GLPPITGLYT 
TVLCLLGYAA FGPSKVLVLG PDSSLGPMIA ATVIPLVTAN GDPGKAVAYA SMLALMVGAI 
TIAAGAFRLG FIADLLSKPT QVGYMNGLAL TIVIGQLPKL FGFSVDGDGL IEEATEFVRG 
VADGRTVPAA LAIGVGSLAV ILLLNRFLPR IPGVLVAVVL AIAAVAVFDL AARGVKLVGT 
LPEGFPPLTI PTVPLTDLGL LFAGALGIAL VSLTDTISTA SAFAGRRGED VNGNREMIGI 
GAANIAAGLF QGFPVSTSGS RTAVAEQNGA RSQVTGLVGA GAVTLMLVFF PGLLRNLPQP 
TLAAIVIAAS ISLADLPALR RLWRQRKSDF ALAMAAFLGV ALLGVLPGIA IAVALSVLNV 
FSRVWRPYRT MLGKVEDLKG YHDIRRYPAA DALPGLVLYR FDGPLIFANA NTFRDDLRRF 
AEATPPPRWI VVTAEPITDV DTTAADMLVE LDLWLNARGI NLVFAEMKDP VKTKIERYEL 
TDTIDPNHFF PTIGSAVRAY RDITGLDWPD RDLPD