Gene Noca_4488 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_4488
Symbol
ID	4597007
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	4744508
End bp	4745632
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	75%
IMG OID	639779099
Product	ROK family protein
Protein accession	YP_925672
Protein GI	119718707
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.520196
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCCCGG TCGGACGACC GCTCCGGCCC CGCGGCAAGC TCCTCCAGGA GGACGCCCGG 
AGGCACCACC GCTCGTTGCT GCTCCAGCAG CTGTTCCGCG AGGGGCCGGC CAGCCGCGCG 
GACCTGGCCC GGACCACCCG CCTGACCCGG GTCACGGTTT CCGACCTGGT GGGCGAGCTG 
GTGGGCGAGG GCCTGGTCGA GGAGCTCGGT GCGCCGGCCG AGGCGCGGGT CGGCAAGCCG 
CCAACGCTGG TCGGGCTGGC GCCGGACGCG AGTCACATCA TCGGGCTGGA CCTCTCGGCC 
GACGACCGGA TGACCGGCGC CGTGGTGAAC CTCCTCGGCC AGGTTCAGGC CCGTCACGAG 
ATCGAGATCG GCGACGCGCA GGGCGAAGCG GCGGTCCGGC TCGTGCACCG CCTCGCGGCC 
GAGCTGATCG CGATGACCGA CCGGCCGGTG CTCGGCGTCG GCGTGGGCAG CCCCGGCGTG 
GTCGACGCCG CCGGCACCGT CATCGACGCC CCCAACTTCG CGTGGACCGA CACCCCGCTG 
TCCACCACCC TGGCCGCCGC GCTCGGCGTA CCGGTCTTCG TGGCCAACGA TGCCAACACC 
GCGGTCCTCG GGGAGCACAC CTTCGGCCAG ACCGGCGACG GCGGCCTGAT GGTGCTCCGG 
GTCGGCATCG GCGTCGGCGC CGGGCTGGTG CTCGGGGGTT CGCTCCTCCA CGGCCACCTC 
GGCGCCGCCG GCGAGATCGG CCACGTCACC GTCGACCCCG ACGGCGACGT GTGCGCCTGC 
GGACGCCGCG GCTGCCTGGA GACGATCCTG GCCGCGCCCC GCCTGCGGCG CCGGCTCGCC 
GAGCCCGGTG CGGACCGGGA CGCCGTGCTC ACCGAGGTGG GTGAGCGGCT CGGCGTCACC 
CTGGCGCCGG TCGTCGGCAC CCTCAACATC CACGAGCTGG TGCTGAGCGG CCCGACCGAG 
CTGCTGGACG GCCCGCTGCG TGCGGCGGCC GACCGGGTCG TGCGCGAGCG GACCATGCCG 
GTCAGCTCCG CGGGCCTGAC GGTCCGCACC TCCACGCTCG GCGCGGACGT GGTGTTGATC 
GGCGCCGCGG TCCTCGTCCT CTCGGGACAG CTGGGCGTGT CGTGA

Protein sequence

MSPVGRPLRP RGKLLQEDAR RHHRSLLLQQ LFREGPASRA DLARTTRLTR VTVSDLVGEL 
VGEGLVEELG APAEARVGKP PTLVGLAPDA SHIIGLDLSA DDRMTGAVVN LLGQVQARHE 
IEIGDAQGEA AVRLVHRLAA ELIAMTDRPV LGVGVGSPGV VDAAGTVIDA PNFAWTDTPL 
STTLAAALGV PVFVANDANT AVLGEHTFGQ TGDGGLMVLR VGIGVGAGLV LGGSLLHGHL 
GAAGEIGHVT VDPDGDVCAC GRRGCLETIL AAPRLRRRLA EPGADRDAVL TEVGERLGVT 
LAPVVGTLNI HELVLSGPTE LLDGPLRAAA DRVVRERTMP VSSAGLTVRT STLGADVVLI 
GAAVLVLSGQ LGVS