Gene Noca_2400 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_2400
Symbol
ID	4599500
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	2558738
End bp	2560537
Gene Length	1800 bp
Protein Length	599 aa
Translation table	11
GC content	67%
IMG OID	639777003
Product	extracellular solute-binding protein
Protein accession	YP_923592
Protein GI	119716627
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.317377
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCCGCCGC TCCAGGCGCG ACACACACCC AAGGAGAAGT TAATGGTCAA GTATCGAAAG 
CGGTTGCTCG CAGCCACCGC TGCGATCGCG ATGGCGGCCA GTCTCGCCGC CTGCGGTGGC 
GGCTCGGACG GCGACAGCAA CCCGGGCGGC TCGAGCAGCG AGCCGGGTGC CGAGGGCGCG 
GCCGGCGGCA CGCTGTACTA CTACATCTAC GCGCCGTACG AGCACGTCGA CCCGCAGCGC 
ACCTACGTCG GTGTCGAGCT GACGAACTTC CGCCGGACGA TCTACCGAAG CCTCGTGGCG 
TTCCCGATCT CGACCGACGC CGAGGTGGCC AACACCCCGG TCCCCGACCT CGCGACCGAC 
ACCGGCACCG ACGCTGACGG CGGCAAGACC TGGTCGTACA CGATCAAGGA CGGCGTCAAG 
TGGGAGGACG GCCAGCCGAT CACGTGTGAG GACTTCAAGT ACGGCGCGTC CCGCGTGTTC 
GCGACCGACG TCATCACCGG TGGCCCGAAC TACCTGCTGA GCTACCTCGA CGTCCCCACC 
GACAAGGCCA CCGGGCTGCC GATCTACACC GGCCCCTACA ACTCGAGCCC CGAGGGCCAG 
GCCGCGTTCG ACAAGGCGAT CACCTGCGAC GGCAACACGA TCACCTACCA CTTCAACAAG 
CCGTGGCCCG ACTTCCCGCT GGCGGTCGCC GGTCTGTCGA TGATGGACCC GTACCGTCAG 
GACAAGGACC AGGGCGCGAA GTCGAACTAC CAGATGTTCT CGAACGGTCC TTACCGGATC 
GAGGGCAGCA CCTGGAACAA GAACAAGGGT GCGACGTTCG TCCGCAACGA GAACTACGAC 
GCCTCGACCG ACTCCACCGA CATCCGCATG GCGCTGCCGG ACCAGATCGA GTTCAACGTG 
GGTCAGACCA CCGAGACGAT CTACGACCAG CTGATCCAGG ACTCCGGTGA CGCTCAGTAC 
GCCGTGACCA GCCAGCGCGT GCCGCCGGCC TACTACTCGC AGATCGTGGG CGACGTGGAG 
AGCCGCTCGG TGCTCGTGGC CTCGCCGTAC GTCGACTACC TGGTGCCGAA CTTCCGGGTG 
CTCGACAACC CCGCGGTCCG CGAGGCGCTC AAGGTCTCGA CGAACACGAC GGCGTGGATC 
AACGCCGGTG GTGGCGAGAA GGCCTACGCC CCGGCCGAGT CGATCGTGAA CCCGGCCGTG 
GTCGGCTACC AGGACAACCC GGCCTTCTCC GGCCCCCAGG AGGGTGACCC GGAGGCTGCG 
AAGCAGATCC TCGAGGACGC CGGCGTCCAG ATGCCGTACC CGATCAAGTT CACCTACCCG 
AGCTCGGAGA CCGCCGACAA GCAGGCCGCG GCGCTCAAGG AGACCTGGGA CAAGGCGGGC 
TTCGACGTGA CCCTCGACGG TCTCGGCGAC ACCTACTACG ACGTCGTGCA GCAGCCCGAC 
AAGGACAGCA GCGTCATGTG GGCCGGCTGG GGCTCCGACT GGCCGTCGGC CATCACCGTC 
ACCCCGCCGC TGTTCGACAG CCGCCCGAAC CTGACCGCGA ACAGCGACGG CCAGGACTAC 
GGCGCCTACA AGAGCGACAA GTTCAACGCT CTGGTCGACC AGGCCGCCAA CGCGGCCACG 
CTGGACGAGC AGACCGCCGC CCTGCAGGAG GCCGACAAGG TCCTCGGTGA GGACGTGGCC 
TACATCCCGC TGGAGATCGC GCAGTTCTTC TTCCTCCACG GGTCGAAGGT CACCGGCTAC 
ACGAACACCC CCGCCTCCTC CATGTACCCG GACCTCGGTC CGATCGGCGT GGAGCAGTGA

Protein sequence

MPPLQARHTP KEKLMVKYRK RLLAATAAIA MAASLAACGG GSDGDSNPGG SSSEPGAEGA 
AGGTLYYYIY APYEHVDPQR TYVGVELTNF RRTIYRSLVA FPISTDAEVA NTPVPDLATD 
TGTDADGGKT WSYTIKDGVK WEDGQPITCE DFKYGASRVF ATDVITGGPN YLLSYLDVPT 
DKATGLPIYT GPYNSSPEGQ AAFDKAITCD GNTITYHFNK PWPDFPLAVA GLSMMDPYRQ 
DKDQGAKSNY QMFSNGPYRI EGSTWNKNKG ATFVRNENYD ASTDSTDIRM ALPDQIEFNV 
GQTTETIYDQ LIQDSGDAQY AVTSQRVPPA YYSQIVGDVE SRSVLVASPY VDYLVPNFRV 
LDNPAVREAL KVSTNTTAWI NAGGGEKAYA PAESIVNPAV VGYQDNPAFS GPQEGDPEAA 
KQILEDAGVQ MPYPIKFTYP SSETADKQAA ALKETWDKAG FDVTLDGLGD TYYDVVQQPD 
KDSSVMWAGW GSDWPSAITV TPPLFDSRPN LTANSDGQDY GAYKSDKFNA LVDQAANAAT 
LDEQTAALQE ADKVLGEDVA YIPLEIAQFF FLHGSKVTGY TNTPASSMYP DLGPIGVEQ