Gene Noca_0885 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_0885
Symbol
ID	4599892
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	923694
End bp	924941
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	74%
IMG OID	639775486
Product	major facilitator transporter
Protein accession	YP_922095
Protein GI	119715130
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAATGCTC CGGTGACCTC GCTCGACAGC CTCGGGACCC GCGAGGACCG GCTCGGCCCG 
CTGCGCTTCC GCAACTTCCG GCTGCTGGTG ACCGGGTCGG CGACCAGCTC GCTCGGCAAC 
GCGATCGCTC CGGTGGCGCT CGCGTTCGCC GTGCTCGATC TCGGCGGCTC GGCCACCGAT 
CTCGGGCTGG TCGTGGCGGC GTACGCCCTC GCGGAGGTGG CGACCGTGCT GTTCGGCGGC 
GTCCTCGGCG ACCGGGTGGC CCGGCAGCTG ATGATGGAGG GCTCCAACGC GGCGTGTGCG 
CTGAGCCAGG CGACAGTGGC GGTCCTCGTG GTGGGCGGCT GGGCGACGAT GCCGGTCCTG 
GCCGGCTTCG GGGTCGTCAA CGGCTGCCTC GGCGCGCTGA GCGGGCCGTC GTCCTCCGCG 
ATGACCCGGA TGACGGTCCC CGCCGAGCGA CTCGCCTCGG CGGTGGCGCT GCGCGGCCTG 
CTCCAGACCA GCGCCGCCGT CGTGGGGTTC GCCGTCGGTG GCGTGCTGGT CGCGGCGGTC 
GGGCCCGGCT GGGCGATCGG CGTCGACGCC GTGACGTTCG CGGTGGCGGC TCTCTGCTTC 
GGCCGCCTCG ACGTGCCGCA CACCCGCCCC GAAGGCGCCC GCCCCTCGTT CGTCAGCGAT 
CTCGGTGAGG GGCTGCGCGA GGTGCTCCGC CACACCTGGC TGTGGCTGCT CATCGGCCAG 
GCGCTGCTGT ACCACCTGTT CTACGGCGGT GCCCAGTCCG TCGTCGGGCC GATCGTGATG 
GAGGACGGGT TCGGCCGATC CAGCTGGGGG CTGGCGCTCG GCACCCTGAT GGCCGGCTTC 
GTCGTCGGCG GGCTCGTGTG CCTGCGGTGG CGTCCGCGCC GGCTGCTGCA CGTCGGGACC 
GCGCTGCTGT CGCTCACCGC GGCCTTCCCG CTGGCGATGG CGCTGAGCGA CCGCCTGGGG 
CCGATCCTCG TCGGCGCCTT CGTGCACGGC GTCGGGCTGC AGGTCTTCGA CGTGTTCTGG 
CAGCTGGCGA TCCAGGAGAA CATCGCCGAG GACAAGCTCG CGCGGGTCTA CTCCTTCGAC 
CTGGTCGGCT CGTTCATCGC CCGGCCGGTC GGCCTCGTGC TGACCGGCCC GGTCGCGCAG 
GCGGTCGGCT TCCACCGCTG GCTGGTCGTC GTCGGCTGCG TGATGGGCGG CAGCGCCCTG 
CTCTCGCTGC TGTCCCCCGA CGTGCGGCGG CTGGAGCGGC GGAGCTGA

Protein sequence

MNAPVTSLDS LGTREDRLGP LRFRNFRLLV TGSATSSLGN AIAPVALAFA VLDLGGSATD 
LGLVVAAYAL AEVATVLFGG VLGDRVARQL MMEGSNAACA LSQATVAVLV VGGWATMPVL 
AGFGVVNGCL GALSGPSSSA MTRMTVPAER LASAVALRGL LQTSAAVVGF AVGGVLVAAV 
GPGWAIGVDA VTFAVAALCF GRLDVPHTRP EGARPSFVSD LGEGLREVLR HTWLWLLIGQ 
ALLYHLFYGG AQSVVGPIVM EDGFGRSSWG LALGTLMAGF VVGGLVCLRW RPRRLLHVGT 
ALLSLTAAFP LAMALSDRLG PILVGAFVHG VGLQVFDVFW QLAIQENIAE DKLARVYSFD 
LVGSFIARPV GLVLTGPVAQ AVGFHRWLVV VGCVMGGSAL LSLLSPDVRR LERRS