Gene Cag_1900 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1900
Symbol
ID	3747645
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	2418637
End bp	2419932
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	47%
IMG OID	637774437
Product	3-isopropylmalate dehydratase
Protein accession	YP_380193
Protein GI	78189855
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0065] 3-isopropylmalate dehydratase large subunit
TIGRFAM ID	[TIGR01343] homoaconitate hydratase family protein [TIGR02086] 3-isopropylmalate dehydratase, large subunit

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCACAAA CAATAACCCA GAAAATTTTT GCAAAATCAG CAAAACGCCC TTTTGTTGAT 
CCCGGCGAAA GTGTTTGGCT TAATGTGGAT GTTCTCCTCA CACATGACGT GTGCGGACCG 
CCCACGATTG ATATTTTTAA AGAGAAATTT GGCTCCAACG CTAAAGTGTG GGATCCCGAA 
AAAGTTATTA TTCTGCCTGA TCACTACATC TTTACTGCCA ACGAACATGC GCACCGCAAC 
ATTGATTTGC TGCGCCAATT TGCTAAAGAG CAAGGCTTAC CTCATTACTA CGATGTTGGC 
ACCGATCGTT ATAAAGGTGT GTGCCATGTA GCACTTGCTG AAGAGGGCTT TAACCTTCCC 
GGTACCGTGC TTTTTGGTAC CGACTCACAC ACCTGCACCT CTGGCGCTTT TGGCATGTTT 
GGTACCGGCA TTGGCAATAC CGATGCGGCA TTTATTCTTG GTACCGGCAA ATTGTGGGAA 
AAAGTACCCG AATCAATGAA GTTCACCTTT GAGGGTGAAA TGCCAGCCTA TTTGACAGCT 
AAAGATCTGA TTTTGCAGAT TCTTGGCGAC ATCACCACCG ATGGTGCAAC CTATCGCGCT 
ATGGAGTTTG ATGGCGAAGC TATTTTCTCT CTGCCAATGG AAGAGCGCAT GACGCTTACC 
AACATGGCAA TTGAAGCGGG TGGCATGAAT GGCATTATTG CAGCCGATAA CATTGCAGAA 
GAGTATGTAA AGGCACGTAC CAAAAAGCCT TACGAGATTT TCCAAAGCGA TCCTGACGCA 
AAGTACCATA GCACCTATCG CTATAACGTG CGTGATTTGG AGCCTGTAGT AGCTCAACCG 
CATAGCCCCG ATAACCGTGC AACCGTGCGT AGCGTAGCTG GCACAAAAAT CACCAAATCG 
TACATTGGCT CATGCACGGG TGGCAAGCTA AGCGACTTTA TGATGGCAGC TAAAATCCTA 
AAAGGGCAGA AAGTTACCGT TACCACAACT ATTGTTCCTG CAACTACTTT AGTAGCTCGT 
AGCCTTGAAA CGGAGCAATA CGATGGCAAA AGCTTAAAGC AAATTTTTGA AGAAGCTGGC 
TGCAACGTTG CTTTACCATC GTGCGCTGCC TGTCTTGGCG GTCCAGCTGA CACCGTTGGT 
CGTTCGGTGG ATAATGACCT TGTGGTTTCA ACAACGAACC GCAACTTCCC TGGACGCATG 
GGTAGCAAAC ATGCAGGCGT TTATCTTGCT TCACCACTTA CGGCAGCGGC ATCAGCAATT 
ACCGGCAAAC TTACCGATCC GAGAGATTTT CTCTGA

Protein sequence

MAQTITQKIF AKSAKRPFVD PGESVWLNVD VLLTHDVCGP PTIDIFKEKF GSNAKVWDPE 
KVIILPDHYI FTANEHAHRN IDLLRQFAKE QGLPHYYDVG TDRYKGVCHV ALAEEGFNLP 
GTVLFGTDSH TCTSGAFGMF GTGIGNTDAA FILGTGKLWE KVPESMKFTF EGEMPAYLTA 
KDLILQILGD ITTDGATYRA MEFDGEAIFS LPMEERMTLT NMAIEAGGMN GIIAADNIAE 
EYVKARTKKP YEIFQSDPDA KYHSTYRYNV RDLEPVVAQP HSPDNRATVR SVAGTKITKS 
YIGSCTGGKL SDFMMAAKIL KGQKVTVTTT IVPATTLVAR SLETEQYDGK SLKQIFEEAG 
CNVALPSCAA CLGGPADTVG RSVDNDLVVS TTNRNFPGRM GSKHAGVYLA SPLTAAASAI 
TGKLTDPRDF L