Gene Noca_4622 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_4622
Symbol
ID	4596078
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	4899480
End bp	4900589
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	75%
IMG OID	639779231
Product	ribokinase-like domain-containing protein
Protein accession	YP_925804
Protein GI	119718839
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0524] Sugar kinases, ribokinase family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0428968
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCTCA CCGAGCGCGA GCAGGAGATC GTGACCCTGC TGCGGCGCGA TCCGCTCGTC 
AGCTCGGCGG CGATCGCCGA AGCGCTCGGG ACCACCCGCG CCGCCGTCAA CGTGCATGTC 
TCGAACCTCA CCCGCAAGGG CATCGTCCTC GGCCGGGGCT ACGTGCTGAA CGAGGGCCCC 
TCGGTGGTGG TCGTCGGCGG CGCCAACATG GACGTCAAGG CCCGCAGCAC CCGCGCCGCC 
GTGGTCGCCA CCAGCAACCC CGGCACGGCC GCGATGGCCG CCGGCGGGGT CGGTCGCAAC 
ATCGCCGAGA ACCTGGCCCG ACTCGGCACC CGGACCCACC TGGTCGCCGC GATCGGCAGC 
GACGCGCTCG GGGACCAGGT GCTCGCCGCG ACCTCGAACG CAGGGGTGGT GGTGGAGCAC 
GTACGCCGCA GCGCCCGGTC GACCGGCACC TACACCGCGG TCCTCGACGC CGACGGCGAG 
CTGGTCGTCG CGGTCGCCGA CATGGCCGCC ACCGACGAGC TCCTGCCTGA CCAGGTCGCG 
GCGGCGCGCG ACCTGGTGTC CGCCGCGTCG CTGGTCGTCC TCGACGGGAA CCTCTCGACC 
GGCACGCTGC GCTACGCCCT CGACCTGGCC GCGGAGGTCG GCACCCGGGT GCTGCTGGAC 
CCGGTCAGCG TCCCGAAGGC TGCCGCGCTC GCGCCGCTCG TCACCGTCGA CCGGCCGGTG 
TTCACGGTGA CCCCCAACCG CGACGAGCTC GCGGCCCTGA CCGATCTCCC GACCCGGACC 
CGGCGCCAGC AGGAGGCGGC GGCGCGGGCC CTGCACGACC GCGGCGTCCA GCTGGTCTGG 
GTGCGGCTCG GCCCGGCCGG CTCGCTGCTC AGCTCACCGA CCGGCGTCGT CGCCCTGGAG 
GCCGTCCCGG CGGGGGTGGC CGGGGAGGTC ACCGACGTGA CCGGCGCGGG CGATGCGATG 
ACAGCGGCCT TCTGCCACGC CCTGCTGACC GGCTCCGACC CGGCCGAGGC CGCGGCGTAC 
GGCCACGCCG CCGCCGCCCT CACCGTCGCC AGCACCGACA CCGTCCGAAC CGACCTCACC 
GACCGACTCG TCAGGAGCCT GCTGTCATGA

Protein sequence

MNLTEREQEI VTLLRRDPLV SSAAIAEALG TTRAAVNVHV SNLTRKGIVL GRGYVLNEGP 
SVVVVGGANM DVKARSTRAA VVATSNPGTA AMAAGGVGRN IAENLARLGT RTHLVAAIGS 
DALGDQVLAA TSNAGVVVEH VRRSARSTGT YTAVLDADGE LVVAVADMAA TDELLPDQVA 
AARDLVSAAS LVVLDGNLST GTLRYALDLA AEVGTRVLLD PVSVPKAAAL APLVTVDRPV 
FTVTPNRDEL AALTDLPTRT RRQQEAAARA LHDRGVQLVW VRLGPAGSLL SSPTGVVALE 
AVPAGVAGEV TDVTGAGDAM TAAFCHALLT GSDPAEAAAY GHAAAALTVA STDTVRTDLT 
DRLVRSLLS