Gene Noca_3688 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_3688
Symbol
ID	4597605
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	3911251
End bp	3912651
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	72%
IMG OID	639778296
Product	extracellular solute-binding protein
Protein accession	YP_924875
Protein GI	119717910
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGGGCGA GTCGGGGGCG CCGCGCGTTG CTGGGCGCCG TGGCCGTGGT CGGGCTGGCC 
CTCTCGGCGG TGGGCTGCAC GGGCGACGGC GCGACGCCGG GGCCGAAGCC GGCCACCAGC 
CCGGTCCAGC CGGAGGTGTC CCGGCTGACG TTCGGGGTCT ACGGAGCGCC GGCCGAGATC 
GCGGCGTACC GCGCCACCGT CGACGCCTGG AACGCCGCCG GCGCGGAGCA GGACCGACCC 
GAGGTCAAGC TGCGCTCCTG GCCCGATCAC GCGGCGATGC GTGCCGACAT CGACTCCGGT 
GCCCCGGTGC CCGACGTGTT CCTGGCCTCG CGGTCGGACC TGAGCTGGCT GCTCGAGAAC 
CGGCACAACC AGCCGGTCGA CGAGCTGCTC GACGAGCGTG GCGTCGAGTT CGGCGACCAG 
TACTCCCGCG ACTCGATCCA GGCGTTCAGC GCCGATGACC GGCTGCAGTG CATGCCGTAC 
GCCGTCTCCC CGATGGTGAT CTACTACAAC CGCGACCTGG TGAACTTCAA CCGGATGCGC 
AAGCGCGGCC TGGACGCCCC GGACCAGGAC GCCAAGAGCT GGTCGTTCGA TCAGTTCGCC 
GCCGCCGCCG ACTTCGCCAC CCGTCCCGGG CGCGGCACCA AGGGCGTGCA CATCGCGGCG 
ACCCTGCCCG GGCTGGCGCC GTTCATCGGC TCCGGTGGCG GCTCGGTGTA CGACGACAAC 
ACCGACCCGA CCTCGCTGGC CTTCTCCAGT GACGGGACCC GCTCGGCGTT GGAGCGCACC 
CTCGAGCTGC TCCGCAACCC GCAGGTCACC CTCGACGACG ACCAGCTCGC CGAGGCCAGT 
CCGCTGACCT GGTTCGAGCG CGGCCGCCTC GGCATGATCG CCGGCTACCG CTCGCTGGTG 
CCGGAGTTGC GCGGGGTCGA CGACCTGGAC TTCGACGTGA TGCCGATGCC GGTGCTCGAC 
AGCTCCTCGA CCGTCGGCGA CGTCACCGGC CTGTGCCTGT CCCGCACCTC CGACAGCGTC 
CCGCTGGCGG CGGACTTCTT GATCCACGAG ATCTCCACCG AGGCCGTGAG CCGGGTGACT 
CGCACCGGCT ACCTCGCCCC CGCCAACCTG GAGGTGGCGC TCTCGGACAC GTTCCTCCAG 
CCCGGCCGGG AGCCGCTCCA CGCGGCGTTC TTCAACTCGA CGGTCCGCTC GATCGACCTG 
CCGCCGCTGA TCGACACCCT CGGCCGGCTC GAGGCGGCGG TGCAGCCGAG CCTCGAGCAG 
CTCGTCTACG GCATCGGCGT ACTCGACCTG GAGGGCCTCA CCGAGCAGAT CGACGAGGAG 
TCCCGGGCGG TCCTCAGCCC GCCCGAGCCC AGCGAACCAC CCAGCCCGAC AGGGCGATCT 
GCGGCGACGC CCTCGTCCTA G

Protein sequence

MRASRGRRAL LGAVAVVGLA LSAVGCTGDG ATPGPKPATS PVQPEVSRLT FGVYGAPAEI 
AAYRATVDAW NAAGAEQDRP EVKLRSWPDH AAMRADIDSG APVPDVFLAS RSDLSWLLEN 
RHNQPVDELL DERGVEFGDQ YSRDSIQAFS ADDRLQCMPY AVSPMVIYYN RDLVNFNRMR 
KRGLDAPDQD AKSWSFDQFA AAADFATRPG RGTKGVHIAA TLPGLAPFIG SGGGSVYDDN 
TDPTSLAFSS DGTRSALERT LELLRNPQVT LDDDQLAEAS PLTWFERGRL GMIAGYRSLV 
PELRGVDDLD FDVMPMPVLD SSSTVGDVTG LCLSRTSDSV PLAADFLIHE ISTEAVSRVT 
RTGYLAPANL EVALSDTFLQ PGREPLHAAF FNSTVRSIDL PPLIDTLGRL EAAVQPSLEQ 
LVYGIGVLDL EGLTEQIDEE SRAVLSPPEP SEPPSPTGRS AATPSS