Gene EcolC_4232 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_4232
Symbol
ID	6067857
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	4676571
End bp	4677500
Gene Length	930 bp
Protein Length	309 aa
Translation table	11
GC content	55%
IMG OID	641603663
Product	branched-chain amino acid aminotransferase
Protein accession	YP_001727155
Protein GI	170022201
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0115] Branched-chain amino acid aminotransferase/4-amino-4-deoxychorismate lyase
TIGRFAM ID	[TIGR01122] branched-chain amino acid aminotransferase, group I

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.583001
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.603299
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACGA AGAAAGCTGA TTACATTTGG TTCAATGGGG AGATGGTTCG CTGGGAAGAC 
GCGAAGGTGC ATGTGATGTC GCACGCGCTG CACTATGGCA CCTCGGTTTT TGAAGGCATC 
CGTTGCTACG ACTCGCACAA AGGACCGGTT GTATTCCGCC ATCGTGAGCA TATGCAGCGT 
CTGCATGACT CCGCCAAAAT CTATCGCTTT CCGGTTTCGC AGAGCATTGA TGAGCTGATG 
GAAGCTTGTC GTGACGTGAT CCGCAAAAAC AATCTCACCA GCGCCTATAT CCGTCCGCTG 
ATCTTCGTCG GTGATGTTGG CATGGGCGTT AACCCGCCAG CGGGATACTC AACCGATGTG 
ATTATCGCCG CTTTCCCGTG GGGAGCGTAT CTGGGCGCAG AAGCGCTGGA GCAGGGGATC 
GATGCGATGG TTTCCTCCTG GAACCGCGCA GCACCAAACA CCATCCCAAC CGCGGCAAAA 
GCCGGTGGTA ACTACCTCTC TTCCCTGCTG GTGGGTAGTG AAGCACGCCG CCACGGTTAT 
CAGGAAGGTA TCGCGCTGGA TGTGAATGGT TACATCTCTG AAGGTGCAGG CGAAAACCTG 
TTTGAAGTGA AAGACGGCGT GCTGTTCACC CCACCGTTCA CCTCCTCCGC GCTGCCGGGT 
ATTACCCGTG ATGCCATCAT CAAACTGGCA AAAGAGCTGG GAATTGAAGT CCGTGAGCAG 
GTGCTGTCGC GCGAATCCCT GTACCTGGCG GATGAAGTGT TTATGTCCGG TACTGCGGCA 
GAAATCACGC CAGTGCGCAG CGTAGATGGT ATTCAGGTTG GTGAAGGCCG TTGCGGCCCG 
GTTACCAAAC GCATCCAGCA AGCCTTCTTC GGCCTCTTCA CTGGCGAAAC CGAAGATAAA 
TGGGGCTGGT TAGATCAAGT TAATCAATAA

Protein sequence

MTTKKADYIW FNGEMVRWED AKVHVMSHAL HYGTSVFEGI RCYDSHKGPV VFRHREHMQR 
LHDSAKIYRF PVSQSIDELM EACRDVIRKN NLTSAYIRPL IFVGDVGMGV NPPAGYSTDV 
IIAAFPWGAY LGAEALEQGI DAMVSSWNRA APNTIPTAAK AGGNYLSSLL VGSEARRHGY 
QEGIALDVNG YISEGAGENL FEVKDGVLFT PPFTSSALPG ITRDAIIKLA KELGIEVREQ 
VLSRESLYLA DEVFMSGTAA EITPVRSVDG IQVGEGRCGP VTKRIQQAFF GLFTGETEDK 
WGWLDQVNQ