Gene Rcas_4404 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_4404
Symbol
ID	5541917
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	5655326
End bp	5656294
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	64%
IMG OID	640896502
Product	ribokinase-like domain-containing protein
Protein accession	YP_001434438
Protein GI	156744309
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0524] Sugar kinases, ribokinase family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.168915
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.135313
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGATG TCGTCTCGAT GGGAGAGTTG CTGGTTGAGT TTGTGGCGAC CATCCCAAAC 
ACGCCGCTGG CGCGCGTGCC CGGTTTCATC AAGGCGCCCG GCGGCGCGCC TGCCAATGTC 
GCCGTCGGGT TACAACGCCT GGGTCTCAGC GCGCGTTTCG TCGGCAAGGT CGGCGACGAT 
CCGTTTGGCA TCTACCTGCG CGAGAGCCTG GCGCAGGAAG GGGTTGATAC CCGTTTTCTG 
CTGGTGGACC GAAGGGCGCG CACCACGGCG GTGTTTGTAG CGGTATGGGA CGACGGGCGC 
AAAGACCTCT GCTTCTACCG CAATCCTGGC GCCGACATGC TGCTTGCGCC GGATGAGATC 
GACGAGCGAA TCTTCGACGG GGCGCGCTGT TTTCATTTTG GCTCAATCGG CTTCATCGAC 
GAACCGTGTG CGTCGGCGCA GCGCCGCGCA CTCGAGATTG CCTGCGCGCG CGGATTAATG 
ATCACCTACG ATCCGAACTA TCGCCCGACC CTCTGGCGCA ACACCGACAC CGCGCGCGCC 
GTCATCCAGG ACTCATTCCG CTTCTGCCAT CTTGCCAAGA TTAGCGAAGA AGAATGGGAG 
ACGGCAACCG GCGAACGCGA CCTCGACGCT GGCATCGCGG CAGTGCTGGC GAAAGGGGTC 
GAACTCCTGG TCATCAGCCG GGGGGCGCGT GGCGCCATTG CGACCAATGG CGCGTATCGC 
ATCGAACTCG CGCCGCCGTC CGTGCCGGTG GTGGAAACAA CCGGCGCCGG CGACGGGTTT 
ATGGCGGCCA TGATCACGCG CCTGCTGCCG GAGCGTGAGC GGGTGGGGTC ACTCGCGCGC 
GTCGAACCCG GTCTTGTGCG CGAAGCGTTA ATCTTCGCCA ACGCCGTTGG CGCGTTGACC 
TGCACCAAAC CGGGCGCCAT TCCGGCGCTG CCAACGCGCA CCGAGGTCGA GCGGTTTCTT 
CAGCAGTGA

Protein sequence

MADVVSMGEL LVEFVATIPN TPLARVPGFI KAPGGAPANV AVGLQRLGLS ARFVGKVGDD 
PFGIYLRESL AQEGVDTRFL LVDRRARTTA VFVAVWDDGR KDLCFYRNPG ADMLLAPDEI 
DERIFDGARC FHFGSIGFID EPCASAQRRA LEIACARGLM ITYDPNYRPT LWRNTDTARA 
VIQDSFRFCH LAKISEEEWE TATGERDLDA GIAAVLAKGV ELLVISRGAR GAIATNGAYR 
IELAPPSVPV VETTGAGDGF MAAMITRLLP ERERVGSLAR VEPGLVREAL IFANAVGALT 
CTKPGAIPAL PTRTEVERFL QQ