Gene Noca_4635 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_4635
Symbol
ID	4596091
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	4915766
End bp	4916971
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	76%
IMG OID	639779244
Product	ROK family protein
Protein accession	YP_925817
Protein GI	119718852
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.892035
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTGCTC CGTCGACCAC CCGCGGCGGC GACCTGCTGC CCGCCGCGAT CCTGGGTCTG 
CTCGGCAGCC GCGGATCCTC GTCCCGGGCC GACATCGCCC GCCTCCTGCG GGTCAGCCCG 
GCGGCCGTCA CCCAGGCCAC CAAGGGGCTG ATCGCTCGCG GGCTGGTCGC CGAGCTCGCG 
GCCGAGCCGT CGCGCGGCGG CCGGCCGGCC CGGCTCCTGG GCCTGGTCCG GGAGGCGGCC 
AGTGCTATCG GGGTCAAGGT GACCGCCGAC CACGTGGCCA CGGTGCGGGT CACGCTCGAC 
GGCCTGGTCG AGGCCTACAG CACCCGCCCC TTCGACCCCT GGGCGCCCGA CGCCCTCGAC 
CGCCTCGGCC GGCTGCTGGC CGACGCCGTC GCGGCCCACG AGGGTGCCCT TCTCGGCGTC 
GGGGTCGGCG TACCCGGCTC CGTGGACGCA CAGGCCTCGG GGGTCGTGAC CGCTCCGACC 
CTGGGCTGGG CCGAGCTGCC CGTCGGTGCC CACCTGCGCG CCGAGCTTGG CGTCCCCGTG 
CTGCTGGACA ACGACGTCAA CACCCTCGCG GCTGCCGAGC GGCTGTACGG CGTCGGTCAG 
GACGCCGCGT CGTACGTCGT CGTCACGATC GGGCGGGGCA TCGGCTGTGG CGTGGTCGTC 
GACGGGTCCA TCTACCGCGG TGCCCGCGGC GGGGCTGGGG AGATCGGACA CATCCCGGTC 
GCCGACGGAC CCGACTGCGC CTGTGGGGGC GTCGGCTGCC TGGAGGCGCT GATCGGCGAG 
GACGCGCTGG TCCGGCGCGG GCGCGAGGAG GGTCTGATCG GTCCCGCGCA GGGCATCGCC 
GAGCTGGCCG GCGCCGCCGA CGACGGCATC GCGGGCGCGC TCGAGCTGTT CGCGCTCGCC 
GGACGCCTGC TCGGCCGGGC GCTCGCCGGC GTGGTCCACA CCATCGACCC GGGGGTGCTG 
GTCATCCAGG GCGAGGGCGT GACGGCCTGG CGGCACTGGC AGTCGCCCTT CGAGACGTCG 
TTTCGCCGGC ATCTGATGCC GAGCCGCCGA TCTCTGCGCT ACCAGGTGCA CGCCTGGTCG 
GAGCAGCAGT GGACCCTGGG GGCCGCCAGT CTGGTGCTCG CCGCCCCGTT CGACTCGACC 
GACACGACCG GCGAGCAGGG CCGCCTGGTG CGGGCCCGTC TGCAGGACCC CGAGGGCGGT 
GCCTGA

Protein sequence

MPAPSTTRGG DLLPAAILGL LGSRGSSSRA DIARLLRVSP AAVTQATKGL IARGLVAELA 
AEPSRGGRPA RLLGLVREAA SAIGVKVTAD HVATVRVTLD GLVEAYSTRP FDPWAPDALD 
RLGRLLADAV AAHEGALLGV GVGVPGSVDA QASGVVTAPT LGWAELPVGA HLRAELGVPV 
LLDNDVNTLA AAERLYGVGQ DAASYVVVTI GRGIGCGVVV DGSIYRGARG GAGEIGHIPV 
ADGPDCACGG VGCLEALIGE DALVRRGREE GLIGPAQGIA ELAGAADDGI AGALELFALA 
GRLLGRALAG VVHTIDPGVL VIQGEGVTAW RHWQSPFETS FRRHLMPSRR SLRYQVHAWS 
EQQWTLGAAS LVLAAPFDST DTTGEQGRLV RARLQDPEGG A