Gene Caul_1761 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1761
Symbol
ID	5899216
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	1859032
End bp	1860138
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	65%
IMG OID	641562251
Product	ribokinase-like domain-containing protein
Protein accession	YP_001683388
Protein GI	167645725
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0524] Sugar kinases, ribokinase family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.550108
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGACA ACATCCTCGA CATCCGCCCG GCTTCGGAAA CGAAGTGGGA TTGCGCCAGC 
TTCGGTGAAG TGATGCTGCG TTTCGACCCC GGCTTCGGCC GGGTTCGCAA CGCGCGCCAG 
TTCAACGTCT GGGAAGGCGG CGGCGAATAC AACGTCGCCC GCGCCTTCAG GAAGTGCTGG 
GGCAAGCGCT CCACCGCCGT CACCGCCCTG CCGGTGAACG ATCTGGGCTG GCTGGTCGAG 
GATCTGATGA TGCAGGGCGG CGTCGACACC TCCCACATCA TCTGGCGCGA CTTCGACGGC 
CTGGGCCGCA ACACCCGGGT TGGCCTCAAC TTCACCGAAA AGGGCTTCGG CGTTCGCCCG 
GCCCTGGGCT GCAGCGACCG GGGCCACTCG GCCGCCTCGC AGATCCGTCC CGGCGAAGTG 
AACTGGGAAA AGCTGTTTGG CGAGGAGGGC GTGCGCTGGT TCCACACCGG CGGCATCTTC 
GCGGCCCTGG CCAGCAACAC TGCAGAGGCC GTGATCGAAG CGGTCGAGGT GGCCCGCAAG 
TACAGCACGG TGATCTCCTA CGACCTGAAC TACCGTGCCT CCTTGTGGAA GTCCCAGGGC 
GGCAAGGAGG GGGCCCAGAA GGTCAACCGC CACATCGCCC AGTACGTGGA CGTGATGATC 
GGCAACGAAG AAGATTTCAC CGCCTGCCTG GGCTTTGAGG TCGAAGGCCT GGACGAGCAC 
ATCAGCGCGA TCGATCCGGC CAACTTCAAG AAGATGATCC AGACGGCCGT GAAGCAGTTC 
CCGAACTTCA AGGTCGCCGC CACCACCCTG CGCAACGCCA AGACCGCCTC GGTCAACGAC 
TGGTCGGCGA TCCTCTACGC CGGCGGCGAG TTCTACGCCT CGATGATGCG CGAGAACCTC 
GAGATCTACG ACCGCGTCGG CGGCGGCGAC GGCTTCGCCT CGGGCCTGGC CTTCGGCTTC 
ATGGAAGGCA AGGGTCCGCA AGCCGCCGTC GAGTATGGCG CGGCTCACGG CGCCCTGGCC 
ATGACCACCC CGGGCGACAC CTCGATGGTG CGCAAGGAAG AGGTCGAGGC CGTGATGAAG 
GGCAAGGGCG CGCGGGTCAT CCGCTAG

Protein sequence

MTDNILDIRP ASETKWDCAS FGEVMLRFDP GFGRVRNARQ FNVWEGGGEY NVARAFRKCW 
GKRSTAVTAL PVNDLGWLVE DLMMQGGVDT SHIIWRDFDG LGRNTRVGLN FTEKGFGVRP 
ALGCSDRGHS AASQIRPGEV NWEKLFGEEG VRWFHTGGIF AALASNTAEA VIEAVEVARK 
YSTVISYDLN YRASLWKSQG GKEGAQKVNR HIAQYVDVMI GNEEDFTACL GFEVEGLDEH 
ISAIDPANFK KMIQTAVKQF PNFKVAATTL RNAKTASVND WSAILYAGGE FYASMMRENL 
EIYDRVGGGD GFASGLAFGF MEGKGPQAAV EYGAAHGALA MTTPGDTSMV RKEEVEAVMK 
GKGARVIR