Gene Noca_3996 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_3996
Symbol
ID	4598131
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	4216738
End bp	4218069
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	74%
IMG OID	639778601
Product	major facilitator transporter
Protein accession	YP_925180
Protein GI	119718215
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2211] Na+/melibiose symporter and related transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.14105
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCAGCCA GCGACACCCT GCCCCGCGGG GTCCGGGTCG GGTACGGGTC GGGCAGCGTG 
GCCACGGGCG CGTTCGGAAC CGTTCCGGGG CTGATGCTCC TGCCCTACCT GACCGACAGC 
CTCGGGATCA GCGCGATCGT CGCCGGGTTC ATCGTGTTCC TGCCCAAGGC GTGGGACGTG 
GTCCTCAACC CCATCGCCGG CCGGATCAGC GACCGCAGCG TGGATCCGCG CGGGCCACGC 
CGGCCCTGGC TGCTGCGCGC GGGGATCGGC CTGGCGGTCG GGTTCGCGCT GCTGTTCGCG 
GCCCCGGAGA TGGGCCGGGT CGCCGAGGCG GCCTGGGTGC TGGCGCTGTT CCTGGCGTGC 
GCCACGGCGT ACGCGTTCTT CCAGGTGCCC TACGTGGCGA TGCCCGCCGA GATGACCTCC 
TCCTACGACG AGCGCACCCG GATCATGACC TGGCGGGTGG CGATCCTGGC GTTCACGATC 
CTGCTCGCCG GGGCGAGCGC CCCGGCGATC CGCGACGCGG TCGGCGGCCG GGACGGCTAC 
CGGGTGATGG GGGTCGCGAT GGCGCTGATC ATCCTGGTCG GCGTCGTCAG CGCGTACGCC 
GGCACCCGCC GGGCACCGGT GACGGCACCG CAGCCGGGCG CGGGCACCCT GCGCGACCAG 
CTCCGGATCG TGGCGGAGGC CCGGGACTTC CGCTGGCTGC TGACCTGCTT CGTCATCCAG 
GCGCTCGCCA CCGGCTGCAT GCTCGCCGGC GTCGACTACC TGGCCTCCGA CGTGCTCGGC 
AAGGATGGCG CGGCCACGGT CCTGTTCGTC TGCTTCGTCG GCCCCGCGCT GCTGCTCACC 
CCGGTGTGGT CGGCGATCGG CACCCGGATC GGCAAGAAGC GCGGCTACCT CGCGGCCTCG 
GTCTTCCTCG GCGCCGGCGC CCTGCTCACG GTGACGGCGC GCAGCGCGCC GCCGGCTTTC 
GTCTTCCTCG CCGTTGCCGT CGTGGGGGTC GGGTACGCCG GGTGCCAGGT GTTCCCGATG 
GCGATGCTGC CGGACGCCGC GGCCGTCGAC GCGGTCCGCA CGGGGTCGAA CCGGGTCGGC 
GTGTACACCG GCGTGTGGAC CGCGGGCGAG ACCCTCGGCC TCGCGCTGGG CCCGGGCGTC 
TACGCGCTGG TCCTGGCGAT CGGCGGCTAC CGGTCCTCCA CCGATGGCGA CGTGGCCCAG 
CCGGACTCGG CGCTCACCGC GATCGTGCTC GGGTTCTCCG TCCTGCCGGC GGTGCTGACG 
GCGCTCAGCC TGCTGTGGCT GCGGCGCTAC TCCCTGGACG CGGCCCAGGT CGAGGCGGCG 
GTGGCGGCAT GA

Protein sequence

MPASDTLPRG VRVGYGSGSV ATGAFGTVPG LMLLPYLTDS LGISAIVAGF IVFLPKAWDV 
VLNPIAGRIS DRSVDPRGPR RPWLLRAGIG LAVGFALLFA APEMGRVAEA AWVLALFLAC 
ATAYAFFQVP YVAMPAEMTS SYDERTRIMT WRVAILAFTI LLAGASAPAI RDAVGGRDGY 
RVMGVAMALI ILVGVVSAYA GTRRAPVTAP QPGAGTLRDQ LRIVAEARDF RWLLTCFVIQ 
ALATGCMLAG VDYLASDVLG KDGAATVLFV CFVGPALLLT PVWSAIGTRI GKKRGYLAAS 
VFLGAGALLT VTARSAPPAF VFLAVAVVGV GYAGCQVFPM AMLPDAAAVD AVRTGSNRVG 
VYTGVWTAGE TLGLALGPGV YALVLAIGGY RSSTDGDVAQ PDSALTAIVL GFSVLPAVLT 
ALSLLWLRRY SLDAAQVEAA VAA