Gene CPF_1772 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_1772
Symbol	ilvE
ID	4202013
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	1997463
End bp	1998488
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	34%
IMG OID	638082644
Product	branched-chain amino acid aminotransferase
Protein accession	YP_696208
Protein GI	110800346
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0115] Branched-chain amino acid aminotransferase/4-amino-4-deoxychorismate lyase
TIGRFAM ID	[TIGR01123] branched-chain amino acid aminotransferase, group II

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0397129
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATAAAA AGACAGCTAT TGATTGGAAT AATCTAGGCT TCTCTTATAT GAAAACAGAT 
TATCGTTACA TATCTCACTA TAAAGATGGT AAATGGGATG AAGGAAAATT AGTTACAGAC 
AACAAATTAA GCATAAGTGA AGCTTCAACT GCCCTTCACT ATGGCCAACA ATGTTTTGAA 
GGTTTAAAAG CTTATAGAAC AAAGGATGGA AAGATTCAAC TTTTTAGAGT AGATGAAAAT 
GCTAAGAGAA TGAATAAATC ATGTGATAAA CTTTTAATGC CTGAAATACC AGTTGAAAAA 
TTCATAGATG CTTGTATGCA AGTTGTCAAG GCTAATGAAA GATTTGTACC TCCATACGGT 
ACTGGTGCAA CTCTTTATAT AAGACCTTTC ATGATAGGTG TTGGTGATAA TATAGGTGTT 
AAATCTGCTC CTGAATTTAT ATTTTCAGTA TTCTGCCTTC CAGTTGGTGC TTATTTTAAA 
GGTGGAATGA AGCCTGTAAA CTTTATGATT GCAGATTATG ATAGAGCTGC TCCTAAAGGA 
ACTGGTGCCG CTAAAGTTGG TGGAAATTAC GCAGCAAGCT TAAAGGCTCA TGAAATAGCT 
GCAAAAAAAG GATTTGCTGA TTGTATATAT TTAGACCCAG CAACTCACAC TAAAATTGAG 
GAAGTTGGAG CTGCAAACTT CTTTGGAATA ACAAAGAAAG GTGAGTTTGT TACTCCATAT 
TCAGAATCAA TTTTACCAAG TATAACAAAA TACTCTTTAA TGCAAATAGC TAAAGATTAT 
TTAAAAATGC CTGTATCAGA AAGAGATGTT TTAATAGATA ACTTAGATGA ATTCGCTGAG 
GCTGGCGCTT GTGGTACAGC CGCTGTAATA ACTCCAATAG GAGGAATAGA ATATAAGAAT 
AAACTTCATG TTTTCCATAG CGAAACTGAA GTTGGTCCTA TTACTAAAAA ACTTTATGAT 
CTTTTATCTG GAATGCAATT TGGAGATGTA GAAGCTCCTG AAGGATGGAT ATTTGAAGTT 
AAATAA

Protein sequence

MDKKTAIDWN NLGFSYMKTD YRYISHYKDG KWDEGKLVTD NKLSISEAST ALHYGQQCFE 
GLKAYRTKDG KIQLFRVDEN AKRMNKSCDK LLMPEIPVEK FIDACMQVVK ANERFVPPYG 
TGATLYIRPF MIGVGDNIGV KSAPEFIFSV FCLPVGAYFK GGMKPVNFMI ADYDRAAPKG 
TGAAKVGGNY AASLKAHEIA AKKGFADCIY LDPATHTKIE EVGAANFFGI TKKGEFVTPY 
SESILPSITK YSLMQIAKDY LKMPVSERDV LIDNLDEFAE AGACGTAAVI TPIGGIEYKN 
KLHVFHSETE VGPITKKLYD LLSGMQFGDV EAPEGWIFEV K