Gene Noca_4632 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_4632
Symbol
ID	4596088
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	4912744
End bp	4914003
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	69%
IMG OID	639779241
Product	extracellular solute-binding protein
Protein accession	YP_925814
Protein GI	119718849
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.448727
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAACA ACCGCAGGCG TCTGACGGCG ATCGCCGTCG CCGGCGTCGC CTCCCTGGCC 
CTGGGCGCCT GCTCCCAGGG CTCGGCGACT TCGAAGGACG ACGGGGCCGA CGGCCAGACC 
ACGATCACCT ACATGGAGTT CTCCTCCAAC GGGGGGCACG AGAAGGACCT GGCCGCGATC 
GTGGACGCGT TCGAGGCCGA CCACCCCGAC ATCAAGGTCG AGGTGGAGAC CACGCCGTAC 
GACGCGTACT TCACCAAGCT CCAGACAGCA CTCGCCGGCG GCACCGCCGG GGACGCCTTC 
GAGCTCAACT ACGAGAACTT CGTGACGTAC GCCGAGAACG GCTCGCTCGC CCAGCTCGGG 
TCCTTCGACG AGGCGGCCTA CAAGCCGTCG CTGCTCGACG CGTTCGCGCA GGACGGCGCC 
CAGTACGCGT TGCCCGAGTC CTTCTCCGAC GTGGTGCTCT TCTACAACAA GGAGCTCTTC 
GACAAGGCCG GCCTGGAGAC GCCCACCTCG GACTGGACCT GGGCGGACGA GCGCGCCGCC 
GCCGAGAAGC TGACCGACAA GGACGCCGGG ATCTGGGGCG ACTACCAGCC GGTGCAGTTC 
TTCGAGTTCT ACAAGGCGCT CGCCCAGTCC GGTGGGTCGT TCTTCAGCGA GGACGGCTCG 
GAGGCGACGT TCGACTCCCC CGAGGGCATC GAGGCGGCCG AGTGGCTGGT GAGCAAGCCG 
GGCAGGACCA TGCCGACCGA GGCCGAGGGC GCCGGCACAC CGGACTTCGA CACGAACCTG 
TTCAAGGACG GCAAGCTCGC GATGTGGCAC AGCGGCATCT GGATGTTCGC CGGCCTGGCC 
GACGTGCCGT TCGAGTGGGA CATCGCCGTC GAGCCGGGCA ACACCCAGCA GGCGTCGGCC 
ATGTTCGCCA ACGGGGTCGC CGTCAACGCG GCGAGCGAGA ACAAGGCGGC TGCCGAGGAA 
TGGCTGTCCT ACCTGACCTC GTCCGAGGTC ACGGCGGACA CCCGCCTGAG CACCTCGTGG 
GAGCTGCCGC CGGTGGCGGA CGAGTCCCTG CTGGCGCCGT ACCTCGACCA GGACAAGCCC 
GCCAACCGGG CCGCTGTGAT GGAGTCCCTG GAGTCCGTGG CGCTGCCGCC GGTCATCGCT 
CGGCAGGCCG AGATGCAGGA CGCGATCACC CAGGAGCTCG GCGAGGCGGC CGCAGGCCGC 
AAGAGCGTGA AGGACGCGCT TGCGGACGCC AAGAAGGCCG TGGACGCCCT GCTCGGCTGA

Protein sequence

MKNNRRRLTA IAVAGVASLA LGACSQGSAT SKDDGADGQT TITYMEFSSN GGHEKDLAAI 
VDAFEADHPD IKVEVETTPY DAYFTKLQTA LAGGTAGDAF ELNYENFVTY AENGSLAQLG 
SFDEAAYKPS LLDAFAQDGA QYALPESFSD VVLFYNKELF DKAGLETPTS DWTWADERAA 
AEKLTDKDAG IWGDYQPVQF FEFYKALAQS GGSFFSEDGS EATFDSPEGI EAAEWLVSKP 
GRTMPTEAEG AGTPDFDTNL FKDGKLAMWH SGIWMFAGLA DVPFEWDIAV EPGNTQQASA 
MFANGVAVNA ASENKAAAEE WLSYLTSSEV TADTRLSTSW ELPPVADESL LAPYLDQDKP 
ANRAAVMESL ESVALPPVIA RQAEMQDAIT QELGEAAAGR KSVKDALADA KKAVDALLG