Gene Caul_3381 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3381
Symbol
ID	5900836
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	3653985
End bp	3655004
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	65%
IMG OID	641563887
Product	ketol-acid reductoisomerase
Protein accession	YP_001685006
Protein GI	167647343
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0059] Ketol-acid reductoisomerase
TIGRFAM ID	[TIGR00465] ketol-acid reductoisomerase

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.392134
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGTCT ATTATGATCG CGACGCCGAC CTCGCTCGTA TCCTGGACAA GAAGATCGCG 
ATCGTAGGCT ATGGTTCGCA AGGTCACGCG CACGCCCTCA ACCTTCGGGA TTCGGGCGCG 
ACCAATGTCG CCGTCGCCCT GCGCGCCGGC TCGCCGACCG CCAAGAAGGC GCAGGGCGAG 
GGCCTGAAGG TCATGACCGT GGCCGAAGCC GCCGCCTGGG CCGACCTGCT GATGATCCTG 
GCGCCCGACG AGCATCAGGC CGCGATCTAC AAGAACGACA TCGCGCCCAA CATCCGCGAC 
GGCGCGGCCC TGCTGTTCGC CCACGGCCTG AACGTCCACT TCGGCCTGAT CGAGCCCAAG 
GACACCATCG ACGTGCTGAT GGTCGCCCCC AAGGGCCCCG GCCACACCGT GCGCGGCGAG 
TATCAAAAGG GCGGCGGCGT GCCCTGCCTG ATCGCGGTGC ACCACAACGC CACCGGCAAC 
GCCCTGGACC TCGGCCTGGC CTATGCCAGC GCCATCGGCG GCGGCCGTTC GGGCATCATC 
GAGACCAACT TCCGCGAGGA ATGCGAAACC GACCTGTTCG GCGAGCAGGC CGTCCTCTGC 
GGCGGCACGG TCGACCTGAT CCGCTGCGGC TTCGAAGTGC TGGTGGAAGC CGGCTACGCG 
CCGGAAATGG CCTATTTTGA GTGCCTGCAC GAACTGAAGC TGATCGTCGA CCTGATCTAT 
GAAGGCGGGA TCGCCAACAT GAACTACTCG ATCAGCAACA CGGCCGAATA CGGCGAATAC 
GTCACCGGTC CGCGCATCGT CACCGCCGAG ACAAAGGCCG AGATGAAGCG CGTGCTGGAA 
GACATCCAGT CGGGCAAGTT CGTCCGCGAC TTCATGCTGG AAAACGCCGT CGGCCAGCCC 
TCGTTCAAGG CCACCCGCCG TCGCGCGAGC GAACACCAGA TCGAGGAAGT CGGCGCCCGC 
TTGCGCGGCA TGATGCCCTG GATCGCCAAG AACAAGCTGG TGGACGTGAC CAAGAACTAG

Protein sequence

MRVYYDRDAD LARILDKKIA IVGYGSQGHA HALNLRDSGA TNVAVALRAG SPTAKKAQGE 
GLKVMTVAEA AAWADLLMIL APDEHQAAIY KNDIAPNIRD GAALLFAHGL NVHFGLIEPK 
DTIDVLMVAP KGPGHTVRGE YQKGGGVPCL IAVHHNATGN ALDLGLAYAS AIGGGRSGII 
ETNFREECET DLFGEQAVLC GGTVDLIRCG FEVLVEAGYA PEMAYFECLH ELKLIVDLIY 
EGGIANMNYS ISNTAEYGEY VTGPRIVTAE TKAEMKRVLE DIQSGKFVRD FMLENAVGQP 
SFKATRRRAS EHQIEEVGAR LRGMMPWIAK NKLVDVTKN