Gene Namu_3367 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3367
Symbol
ID	8448982
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	3705660
End bp	3706850
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	75%
IMG OID	645042444
Product	major facilitator superfamily MFS_1
Protein accession	YP_003202684
Protein GI	258653528
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.0109833
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0295865
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGTCCCA CGCCCGCGAC CGCGTCCCCG GCGCGCGCGT GGACCATGCT GGCGCTGGGC 
ACCGCGGCGC AGACCGCGGG CACGGTCTTC GTCTCGACCC CGGCCTTCCT CATCCCGCTG 
TTGCACGAGC AGCGCTCGCT CTCGCTGGCG CAGGCCGGTC TGGTGGCCTC CGCACCGCTG 
GTGGGTCTGG TGCTCTCGTT GATCGCCTGG GGAGCGCTGG CCGATCGTCG GGGCGAGCGC 
CTGGTCATCG CCAGCGGTCT CGCGCTGACC GCGGTGGCCA CGGTCGGCGC CATGTTCTCG 
ACCGGTTACG TGGCCCTTGG CCTGTTCTTC GTGCTCGGCG GGGTCGGCGC GGCCAGCACG 
AACGCGGCCA GCGGGCGCGT CGTGGTGGGC TGGTTCGCCA AGGATCGACG CGGCCTGGCG 
ATGGGGGTCC GGCAGATCGC CCAGCCCCTG GGCACCACCC TGGCCGCGGT CATCGTGCCG 
ACCGCCGCCG AGTCGGGGAT CGACGCCGCG CTGGCCGTCC CGTTGATCGC GGTGGCCCCG 
TTGGCGGTGA TCTGCGCGAT CGGCATCCGG AACCCGCCGC GGCCGGCGTC GGCCCCGGCC 
CTGGCCACCG CCAATCCCTA CCGCGGCTCG GGGTTCCTGT GGCGGATCCA TCTGGTCTCG 
GTGCTGCTGG TGGTGCCGCA GTACACCCTG GCGTTGTTCG GGCTGCTGTG GTTGATCGCG 
GGCCAGGGCT GGGATCCGAT CGGGGCCGGG CTGGTGATCG GCGCGGCGCA GTTCGTCGGC 
GCGCTCGGCC GCATCGGAGC CGGCGTGCTC AGCGATCGGA TCGGCAGCCG GGTGCGGCCG 
CTGCGGTGGA TCTCGCTGGC CGCCGCCGCG TCGATGCTCG CGCTGGCCGC GGCGGCGGCC 
ACCCAGTGGA GCCTGGCGCC GCTGGTGCTG GTCGTGGCCA CCACCATCTC CGTCGCCGAC 
AACGGTCTGG CCTTCACCTC GGTGGCCGAG GTGGCCGGGC CGGTCTGGGC CGGCCGGGCC 
CTGGGCGTGC AGAACACCGG GCAGTTCGTG GCCGCCGCGG CGGTGGGGCC GGTCGTCGGC 
GTCCTGATCA CGGTCCTGGG CTACCCGCTG GCGTTCGCCG CGTCGGCGGT GGCGCCCGTC 
CTGGCCACCC CTCTGATCCC GGACGCCCGG GCCGAACGCG ACCGGCTCTA G

Protein sequence

MGPTPATASP ARAWTMLALG TAAQTAGTVF VSTPAFLIPL LHEQRSLSLA QAGLVASAPL 
VGLVLSLIAW GALADRRGER LVIASGLALT AVATVGAMFS TGYVALGLFF VLGGVGAAST 
NAASGRVVVG WFAKDRRGLA MGVRQIAQPL GTTLAAVIVP TAAESGIDAA LAVPLIAVAP 
LAVICAIGIR NPPRPASAPA LATANPYRGS GFLWRIHLVS VLLVVPQYTL ALFGLLWLIA 
GQGWDPIGAG LVIGAAQFVG ALGRIGAGVL SDRIGSRVRP LRWISLAAAA SMLALAAAAA 
TQWSLAPLVL VVATTISVAD NGLAFTSVAE VAGPVWAGRA LGVQNTGQFV AAAAVGPVVG 
VLITVLGYPL AFAASAVAPV LATPLIPDAR AERDRL