Gene Caul_0216 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0216
Symbol
ID	5897490
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	229993
End bp	231435
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	69%
IMG OID	641560700
Product	isopropylmalate isomerase large subunit
Protein accession	YP_001681851
Protein GI	167644188
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0065] 3-isopropylmalate dehydratase large subunit
TIGRFAM ID	[TIGR00170] 3-isopropylmalate dehydratase, large subunit

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.146559
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCGCG CACCGAAGAC CCTTTACGAC AAGATCTGGG ACGCCCACGT CGTCAGCCAA 
CTGGACGGCG AGGCGATCCT CTATATCGAC CTGCACCTGA TCCACGAGGT GACCACCCCG 
CAGGCCTTCG CCGGGCTCCG CGCGGCCGGC CGCAAGGTGC GCCGGCCCGA CCGCACGCTG 
GCCGTGGCCG ATCACAATAT CCCAACCGAG GGCCAGGCCC TGGGCGTCGA CGCCGTGGCC 
GACGAAGAGG CGCGCCTGCA ACTCCAGACC CTGGCGCGCA ACGTCAAGGA CAACGGCATA 
GAGTTCTTCC CGATGGGCGA CATCCGCAAC GGGATCGTCC ACGTGGTCGG TCCCGAGCAG 
GGCCGCACCC AGCCGGGCAT GACCATCGTC TGCGGCGACA GCCACACCTC GACCCACGGC 
GCCTTTGGAG CCCTGGCCCA CGGCATCGGG ACCTCCGAGG TCGAGCATGT GCTGGCCACC 
CAGACCCTGC GCCAGGAGAA GGCCCGGAAC ATGCTGGTGC GCGTCGATGG CCAGCTGGGT 
CCCGGCGTCA CGGCGAAGGA TGTTGCGCTG GCCGTGATCG GCGAGATCGG CACCGCCGGC 
GGCACCGGCT ACGTCATCGA GTTCGCCGGC GACGTGGTCC ACGACCTGTC GATGGAAGGC 
CGCATGACCC TGTGCAACCT GACCATCGAG GGCGGCGCCA AGGCCGGCCT GGTCGCGCCG 
GACGACAAGA CCTTCGCCTA TATCCAGGGC AAGCCTTCGG CGCCGAAAGG CGCGGCCTGG 
GACATGGCCC TGTCGTACTG GAAGAGCTTC GTCAGCGACG AGGACGCCCA TTTCGACCGC 
ACGGTGGTCA TCGACGGCTC GGCCCTGGTC CCGATGGTCA CCTGGGGCAC CAGCCCCGAG 
GACGTCATCC CGGTGACCGG CAATGTTCCA GATCCGGAAA GTTTCGCCAC GCCCGACAAG 
CGCGCCGCCG CCCACCGGGC GCTGGACTAT ATGGGCCTGA CCGCCGGCCA GCCGATCTCG 
GAAGCCCGCA TCGACCGCGT CTTCATCGGC TCGTGCACCA ACAGCCGGAT CGAAGACATG 
CGCGCCGCCG CCGCCGTAGT GCAGGAAGCC TTCCTGCACG GCCGCCTGGT GGCCCCGCAC 
GTCAAGGCGA TGGTCGTGCC GGGCTCGGGC CTGGTGAAGG AACAGGCCGA AGAAGAGGGG 
CTGGACGCCA TCTTCAAGGC TGCGGGCTTC GACTGGCGCG AGCCGGGCTG CTCGATGTGC 
CTGGCCATGA ACCCCGACAA GCTGCAGCCG CACGAACGCT GCGCCTCGAC CAGCAACCGC 
AACTTCGAAG GCCGCCAGGG TCGCGCCGGC CGCACCCACC TGGTCTCGCC GGCCATGGCC 
GCGGCGGCGG CGATCGCGGG CCATTTGGTC GATGTGCGCG CCCTGCTCGA GGAGACCATC 
TGA

Protein sequence

MTRAPKTLYD KIWDAHVVSQ LDGEAILYID LHLIHEVTTP QAFAGLRAAG RKVRRPDRTL 
AVADHNIPTE GQALGVDAVA DEEARLQLQT LARNVKDNGI EFFPMGDIRN GIVHVVGPEQ 
GRTQPGMTIV CGDSHTSTHG AFGALAHGIG TSEVEHVLAT QTLRQEKARN MLVRVDGQLG 
PGVTAKDVAL AVIGEIGTAG GTGYVIEFAG DVVHDLSMEG RMTLCNLTIE GGAKAGLVAP 
DDKTFAYIQG KPSAPKGAAW DMALSYWKSF VSDEDAHFDR TVVIDGSALV PMVTWGTSPE 
DVIPVTGNVP DPESFATPDK RAAAHRALDY MGLTAGQPIS EARIDRVFIG SCTNSRIEDM 
RAAAAVVQEA FLHGRLVAPH VKAMVVPGSG LVKEQAEEEG LDAIFKAAGF DWREPGCSMC 
LAMNPDKLQP HERCASTSNR NFEGRQGRAG RTHLVSPAMA AAAAIAGHLV DVRALLEETI