Gene Noca_1785 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_1785
Symbol
ID	4597697
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	1896989
End bp	1898470
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	68%
IMG OID	639776384
Product	major facilitator transporter
Protein accession	YP_922984
Protein GI	119716019
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGTCG AAACCGGTCG GATCACCACC GACATCCCCG CGCGTCTGGA CCGGCTCCCG 
TGGGCCCGGT GGCACTGGCT GGTCGTGATC GGACTCGGCA CGGTCTGGAT CCTGGACGGC 
CTCGAGGTCA CCATCGTCGG CTCGATGTCG GACGCCCTCA AGCCCGACGG CACCGGCCTG 
GGCATGAACA ACTTCGACAT CGGCCTCGCG GGCTCGATGT ACGTCGCCGG TGCCTGCCTC 
GGCGCCCCCT TCTTCGGGCA GCTCACCGAC CGGCTCGGCC GCAAGAAGCT GTTCATCGTC 
ACGCTCGCGG TCTACACCGT GGCCACCGTG CTGACGGCGT TCTCGATGAA CCCGATGTGG 
TACTTCGCCT GCCGCTTCCT GACCGGTTGC GGCATCGGCG GTGAGTACGC CGCGATCAAC 
TCCGCCATCG ACGAGCTGAT CCCCGCGAAG TACCGCGGTC GCGTCGACAT CGCCATCAAC 
GGCTCGTTCT GGGTCGGTGC GGCCGGGGGC GCGCTGCTGA CGATCCCGCT GCTCGACCCG 
ACGATGATCG ACCAGTCCTG GGGCTGGCGG CTCGCCTTCG GCCTGGGCGC GATCCTCGCC 
GTCGGCATCC TGGTCGTCCG GCGCAACGTC CCGGAGAGCC CGCGCTGGTT GTTCATCCAC 
GGCCGCGAGG ACGAGGCGGA GCAGATCGTC CGCGACATCG AACGCACCGT CTCCGAGGAG 
TCCCACCACC AGCTGCACGA CGTGCACGAC ACGATCACGG TGCGGCAGCG CACGTCGATC 
GGCATCGGCC TGATCGCGAG GACGGTCTTC ACCCTGTACC CGAAGCGGAC GATCCTGTGC 
TTCTCGCTGT TCGTCGGGCA GGCGTTCTTG TACAACGCCT TCTTCTTCAC CTACGGCGAC 
ACCCTGACGA CCTTCCTCGG CGTGGAGCAG ACCGGCTACT ACATCGCGGT GTTCGCGGCG 
AGCAACTTCG CCGGGGCGCT GCTGCTGAGC CCGCTGTTCG ACACCCTGGG CCGGGTCAAG 
ATGATCACCG CGACCTACAT CGGGTCCGGG GTCCTGCTCG CCGTGACCGG CTTCTACCTG 
GGCAGCTTCG ACGCCACCAC CCTCACGCTG ATGGGCGCGA TCATCTTCTT CATGGCCTCG 
GCCGGCGCGA GTGCGGCGTA CCTCACCGCC AGCGAGGTGT TCCCGATGGA GACCCGGGCC 
CTGTGCATCG CGTTCTTCTA CGCGATCGGC ACCGCGGCCG GCGGCATCTC CGGCCCGCTG 
TTCTTCGGCT GGCTGATCGA GCAGGCCTCG GCGGACAAGG ACATCACGCA GATCGCGGTC 
GGCTACTTCC TCGGCGCCGC GCTGATGATC ATCGGTGGCA TCGTCGAGGC GTTCCTGGGC 
GTCAAGGCGG AGGGCAAGTC GCTGGAGAGC ATCGCCCAGC CGCTCACCGC CGAGGACACC 
GACACCGGTA GCACCGGCTC CACGCAGCCA CAGCACGCCT GA

Protein sequence

MAVETGRITT DIPARLDRLP WARWHWLVVI GLGTVWILDG LEVTIVGSMS DALKPDGTGL 
GMNNFDIGLA GSMYVAGACL GAPFFGQLTD RLGRKKLFIV TLAVYTVATV LTAFSMNPMW 
YFACRFLTGC GIGGEYAAIN SAIDELIPAK YRGRVDIAIN GSFWVGAAGG ALLTIPLLDP 
TMIDQSWGWR LAFGLGAILA VGILVVRRNV PESPRWLFIH GREDEAEQIV RDIERTVSEE 
SHHQLHDVHD TITVRQRTSI GIGLIARTVF TLYPKRTILC FSLFVGQAFL YNAFFFTYGD 
TLTTFLGVEQ TGYYIAVFAA SNFAGALLLS PLFDTLGRVK MITATYIGSG VLLAVTGFYL 
GSFDATTLTL MGAIIFFMAS AGASAAYLTA SEVFPMETRA LCIAFFYAIG TAAGGISGPL 
FFGWLIEQAS ADKDITQIAV GYFLGAALMI IGGIVEAFLG VKAEGKSLES IAQPLTAEDT 
DTGSTGSTQP QHA