Gene Clim_0737 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0737
Symbol
ID	6356018
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	807097
End bp	808392
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	54%
IMG OID	642668362
Product	homoaconitate hydratase family protein
Protein accession	YP_001942797
Protein GI	189346268
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0065] 3-isopropylmalate dehydratase large subunit
TIGRFAM ID	[TIGR01343] homoaconitate hydratase family protein [TIGR02086] 3-isopropylmalate dehydratase, large subunit

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCACAAA CAATAACCCA GAAAATTCTC TCGAGAGCCG CTAACCGGAA ATTTGTCGAT 
GCCGGTGAAA ACGTCTGGCT CAATGTCGAC ATCCTGCTCA CTCATGACGT GTGCGGACCG 
CCGACCTTCG ATATTTTCAA GCAGGAGTTC GGCCCGGATG CAAAAGTATG GGACCCCGAA 
AAGGTCGTGG TCCTGCCAGA CCACTATATT TTTACAGCAA ATGAGCATGC ACACCGCAAT 
ATCGACCTGT TGAGACAGTT TGCATCGGAA CAGAGTCTCC CCAACTACTA CGATGTCGGC 
ACCGACCGTT ACAAAGGGGT CTGCCATGTA GCTCTTGCTG AAGAGGGATT CAATATTCCG 
GGTACGGTTC TGTTCGGCAC GGACTCGCAT ACCTGTACCT CGGGAGCATT CGGCATGTTC 
GGCTCCGGAA TCGGAAACAC TGACGCAGCC TTCATTCTCG GCACAGGCAA GCTCTGGGAA 
AAGGTGCCTG AGTCCATGAA ATTCATCTTC GAAGGCGACA TGCCGGAATA CCTCTGCGCA 
AAGGATCTCA TTCTGCAGAT TCTCGGCGAC ATAGGCACCG ACGGAGCAAC TTACCGGGCA 
ATGGAATTCG ACGGCGAAGC GGTCTACTCT CTTCCGGTCG ATGAGCGCAT GACCCTGTGC 
AATATGGCTA TCGAAGCAGG AGGCATGAAC GGCATCATCG CGGCCGACGC CGTTACCGAA 
GCTTATGTAA AGGCACACAG CAGCAAACCC TACGAAATCT TCCAAAGCGA TCCCGACGCC 
GACTATCACA GCGTTTACCG ATATAACGCA AGGGAACTGG AACCGGTTGT GGCAAAACCG 
CACAGTCCGG ACAACAGGGC TACCGTCAGA AGCATGCAGG GCACGAAAAT CACCAAGTCC 
TATATAGGCT CCTGCACCGG AGGCAAACTG ACCGATTTCA TGCTTGCAGC GAAAATTCTT 
AAAGGCAAAC AGGTTACCGT ACCGACCAAC ATCGTTCCGG CAACCGTGCT TGTAGCCCGC 
GCCCTGGAAT GTGAAACATG GGAAGGCGTT ACACTGAAAA AGATTTTTGA AGATGCCGGA 
TGCAGCATAG CCCTGCCCTC ATGCGCAGCA TGTCTCGGCG GGCCTGCAGA TACCGTGGGA 
CGCTCGGCCG ATCAGGATGT TGTGGTCTCC ACGACGAACC GCAACTTCCC GGGACGCATG 
GGAAGCAAGA AAGCCGATGT CTATCTTGCC TCTCCGCTTA CCGCTGCAGC ATCTGCAGTT 
ACCGGAAAAC TAACCGATCC AAGGGAGTTC CTCTGA

Protein sequence

MAQTITQKIL SRAANRKFVD AGENVWLNVD ILLTHDVCGP PTFDIFKQEF GPDAKVWDPE 
KVVVLPDHYI FTANEHAHRN IDLLRQFASE QSLPNYYDVG TDRYKGVCHV ALAEEGFNIP 
GTVLFGTDSH TCTSGAFGMF GSGIGNTDAA FILGTGKLWE KVPESMKFIF EGDMPEYLCA 
KDLILQILGD IGTDGATYRA MEFDGEAVYS LPVDERMTLC NMAIEAGGMN GIIAADAVTE 
AYVKAHSSKP YEIFQSDPDA DYHSVYRYNA RELEPVVAKP HSPDNRATVR SMQGTKITKS 
YIGSCTGGKL TDFMLAAKIL KGKQVTVPTN IVPATVLVAR ALECETWEGV TLKKIFEDAG 
CSIALPSCAA CLGGPADTVG RSADQDVVVS TTNRNFPGRM GSKKADVYLA SPLTAAASAV 
TGKLTDPREF L