Gene Rcas_3516 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3516
Symbol
ID	5541015
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	4581228
End bp	4582460
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	57%
IMG OID	640895634
Product	3-isopropylmalate dehydratase
Protein accession	YP_001433584
Protein GI	156743455
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0065] 3-isopropylmalate dehydratase large subunit
TIGRFAM ID	[TIGR01343] homoaconitate hydratase family protein [TIGR02086] 3-isopropylmalate dehydratase, large subunit

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGCAAA CGATTGCAGA AAAGGTTGTG TCGCACCATG CAGGGCGTCA GGTCATGGCG 
AACGAGATTG CAATTGTTGC GATTGATGGC GCAATGGCAA CCGACGCAAC CGCTCCATTG 
GCGATTAAGG CCTTCCGTGA GATGGGTGGG GTTCGTTTGT GGGATCCGTC GCGTGTTGTG 
TTGGTGATTG ACCATGCCGC TCCGGCGCCG AATGAGCAGG TGAGCAATCT TCACGCTCTG 
ATGCGCGCCT TTGGGCGTGA GATGGGATGT GTCTTATATG ATGTTGGCGA GGGTATCTGC 
CATCAGTTGA TGGTTGAATA TGATCACGTG CGTCCTGGCC AGATCATTCT TGGCGCCGAT 
TCCCATACTC CAACGTATGG GGCGCTTGGC GCGTTTGCTA TGGGTGTCGG CTCAACCGAT 
CTGGCAGCCG CATGGTTGAC CGGAAAGACG TGGCTCAAGA CGCCTGCAAG TATCAAGATT 
GTGCTGGACG GCACGTTGCG CACCGGTGTG AGCGCGAAGG ATCTCGTCTT ATTTCTGGTC 
AGGCAGATTG GCGCTGATGG CGCACGGTAT CAGGCGGTTG AGTTCACCGG TTCGGCAATT 
CGCTCATTGA GCCTCGCTTC GCGAATGACG CTGGCCAATA TGACTGCTGA AATGGGGGCG 
CTGACGGCAT TTGTCGACCT GCAAGGATTA GACTTGCCAT ACCGATTCGA TCCAATTCAC 
CCCGATCCGG ATGCGGTCTA TAGTGTTGTC TATTCATTCA ACGTGGACCA TCTGCTCCCA 
CAAGTGGCTA TTCCGCATGC GCCCAGCAAT GTGGTTCCCA TCGATGAAGT AGCGGGTACG 
CCGATCCAGA TGGCATTCAT CGGTTCTTGC ACCAACAGTC GTCTCGAAGA TCTGCGCGCA 
GCAGCAGCGG TATTACAAGG GCGCAAACTC GCCCCCGGCG TGCGCCTCAT TATCGCGCCT 
GCATCACGGC AAGTCTTCAT GATGGCGCTG CAAGACGGCA CTATTGCCAC TCTCACCGAA 
TCGGGCGCAA CCTTCATCAC CGCCGGGTGT GGTCCTTGCG TCGGTACCCA TCAGGGGATT 
CCCGGTAATG GCGAGAATGT CATCACCAGC ACGAATCGCA ACTTCCGGGG ACGTATGGGT 
AATCCGCACG CCAGCATTTA TCTCGCGTCG CCGGCAGTTG TGGCAGCTTC GGCACTGCGC 
GGCGTCATTA CCGATCCTGC TGACGTACTC TGA

Protein sequence

MGQTIAEKVV SHHAGRQVMA NEIAIVAIDG AMATDATAPL AIKAFREMGG VRLWDPSRVV 
LVIDHAAPAP NEQVSNLHAL MRAFGREMGC VLYDVGEGIC HQLMVEYDHV RPGQIILGAD 
SHTPTYGALG AFAMGVGSTD LAAAWLTGKT WLKTPASIKI VLDGTLRTGV SAKDLVLFLV 
RQIGADGARY QAVEFTGSAI RSLSLASRMT LANMTAEMGA LTAFVDLQGL DLPYRFDPIH 
PDPDAVYSVV YSFNVDHLLP QVAIPHAPSN VVPIDEVAGT PIQMAFIGSC TNSRLEDLRA 
AAAVLQGRKL APGVRLIIAP ASRQVFMMAL QDGTIATLTE SGATFITAGC GPCVGTHQGI 
PGNGENVITS TNRNFRGRMG NPHASIYLAS PAVVAASALR GVITDPADVL