Gene Athe_0507 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_0507
Symbol
ID	7408631
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	576528
End bp	578108
Gene Length	1581 bp
Protein Length	526 aa
Translation table	11
GC content	41%
IMG OID	643714889
Product	putative alpha-isopropylmalate/homocitrate synthase family transferase
Protein accession	YP_002572406
Protein GI	222528524
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR00977] 2-isopropylmalate synthase/homocitrate synthase family protein

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGAAAATA ATAAGACCAT CATCATCTAT GACTCAACCT TAAGAGACGG TGCTCAGGCT 
GGTGGAATTT CATATACTCT GGAAGATAAG CTCAAGATTG TAGAGAGGCT TGACAAATTT 
GGTGTGAAAT TTATCGAAGC AGGGAATCCC GGTTCTAACA TCAAAGACCA GGAATTTTTT 
GCAAGAGTTA AAAAGATGAG ATTGAAAAAC GCAAAGCTTA TCGCCTTTGG TTCAACAAGG 
CGAGTGGGGA TTAACGTGAA AGATGACCCT AACATTCAGT CACTCATTGC GGCTGATACC 
GAAGCTGTTG CAATCTTTGG CAAGTCATGG GATTTTCATG TTAAAGAGGT CTTGAAAACA 
ACAGAGGATG AAAATCTTCA GATGATTTAT GATACTATAA AATATTTAAA GTCATTGGGG 
AAGTATGTTG TATTTGATGC AGAGCACTTT TTTGATGGTT ATAAAAATAA CAAAAAGTAC 
GCTTTGGAGA CTTTAAAGGT TGCAAAAGAA GCAGGTGCAG ACTCTTTGGA CCTGTGCGAT 
ACAAATGGCG GTACTTTCCC AATGGATGTT TACAACATCA CGAAAGAAGT TGTTGAGATG 
TTTCCTGGGA CGATGATTGG AATTCACTGT CATAACGACA CAGGCATGGC TGTTGCAAAC 
TCAGTCATGG CGGTTTTGGC AGGAGCTCGT CAGGTTCAGG GGACTATAAA CGGATATGGT 
GAGAGATGTG GAAACGCAGA CCTTATTACA CTCATACCAA ATCTTCAGCT AAAGCTTGGC 
TTTAAATGTG TACCAGATGA GAACATAAAA CACCTGACAT CACTTTCAAG GTATGTTGCA 
GAGATTGCCA ACATGATTCC AAACGAGCGC GCACCATATG TTGGAGCTTA TGCGTTTACT 
CACAAGGCTG GTATGCACAT TGATGCTGTC AAGAAAAATC CAGCTTCGTT TGAGCATATT 
AACCCTGAGA TTGTTGGAAA CACAAGAAGA ATAGTACTGT CTGAGGTTGC AGGAAGGGCT 
ACAATTCTTG ACAAGATTCG CGAGATTGAC CCGACAGTTA CAAAAGACTC ACCTGTCACA 
AAAGAGATTA TTGATGAGCT AAAGCGTCTT GAAAATGAAG GGTATCAGTT TGAGTCTGCA 
GAGGCTTCAT TTGAGATGTT AATTAGAAAA AAACTGGGAC TTTACCAGCC GTTCTTTACT 
CTCAAAGAAT TTAAAGTTCT CATTAATGAA CCGGCAGTAG AGTACAGCTC ATCTGCAATT 
GTAAAGATTG CGGTAGATGG GGTTACAGCA ATCACTGCTG CAGAAGGTGA TGGTCCTGTT 
CATGCTTTAG ATAGTGCTTT GAGAAAGGCA TTGGAAAAGT TCTACCCAGA GCTCAAAGAG 
GTTCATCTTG TTGACTACAA AGTAAGAGTG CTCAACGCCG AGACTGCAAC TGCTGCAAAG 
GTAAGGGTTC TGATTGAGTC AACAGACGGC AAAGACACAT GGACAACTGT AGGTGTTTCA 
ACCGACATTG TAAATGCAAG CTGGATTGCA CTTGTTGACT CACTGGAGTA TAAGCTTTGC 
AAAGAAAAAG TGGGAAAATA A

Protein sequence

MENNKTIIIY DSTLRDGAQA GGISYTLEDK LKIVERLDKF GVKFIEAGNP GSNIKDQEFF 
ARVKKMRLKN AKLIAFGSTR RVGINVKDDP NIQSLIAADT EAVAIFGKSW DFHVKEVLKT 
TEDENLQMIY DTIKYLKSLG KYVVFDAEHF FDGYKNNKKY ALETLKVAKE AGADSLDLCD 
TNGGTFPMDV YNITKEVVEM FPGTMIGIHC HNDTGMAVAN SVMAVLAGAR QVQGTINGYG 
ERCGNADLIT LIPNLQLKLG FKCVPDENIK HLTSLSRYVA EIANMIPNER APYVGAYAFT 
HKAGMHIDAV KKNPASFEHI NPEIVGNTRR IVLSEVAGRA TILDKIREID PTVTKDSPVT 
KEIIDELKRL ENEGYQFESA EASFEMLIRK KLGLYQPFFT LKEFKVLINE PAVEYSSSAI 
VKIAVDGVTA ITAAEGDGPV HALDSALRKA LEKFYPELKE VHLVDYKVRV LNAETATAAK 
VRVLIESTDG KDTWTTVGVS TDIVNASWIA LVDSLEYKLC KEKVGK