Gene EcE24377A_0621 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_0621
Symbol
ID	5590439
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	656259
End bp	657419
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	54%
IMG OID	640924338
Product	putative aminotransferase
Protein accession	YP_001461764
Protein GI	157156761
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAAATA ACCCTCTGAT TCCACAAAGC AAACTTCCAC AACTTGGCAC CACTATTTTC 
ACCCAGATGA GCGCGCTGGC GCAGCAACAC CAGGCGATTA ACCTGTCGCA AGGCTTTCCT 
GATTTTGATG GTCCGCGCTA TTTACAGGAG CGGCTGGCGT ACCACGTTGT CCAGGGGGCA 
AACCAATACG CGCCCATGAC CGGCGTGCAG GCCTTGCGCG AGGCGATTGC TCAGAAAACG 
GAACGTTTGT ATGGCTATCA ACCAGATGCC GATAGCGATA TCACCGTAAC GGCAGGGGCG 
ACGGAAGCGT TATACGCGGC GATTACCGCA CTGGTGCGCA ATGGCGATGA AGTGATTTGT 
TTTGATCCCA GCTATGACAG TTACTCCCCC GCCATCGCGC TTTCTGGGGG AATAGTGAAG 
CGTATGGCAC TGCAACCACC GCATTTTCGC GTTGACTGGC AGGAATTTGC CGCATTATTA 
AGCGAGCGCA CCAGACTGGT GATCCTCAAC ACTCCGCATA ACCCCAGTGC AACTATCTGG 
CAGCAGGCTG ATTTCGCCGC TTTGTGGCAG GCGATCGCCG GGCACGAGAT TTTTGTCATT 
AGCGATGAAG TCTACGAGCA CATCAACTTT TCACAACAGG GCCATGCCAG TGTGCTGGCG 
CATCCGCAGC TGCGTGAGCG GGCAGTGGCG GTTTCTTCAT TTGGCAAGAC CTATCATATG 
ACCGGCTGGA AAGTGGGTTA TTGTGTTGCG CCAGCGCCCA TCAGCGCCGA AATTCGCAAG 
GTACATCAGT ATCTGACCTT TTCGGTGAAT ACCCCGGCAC AGCTGGCGCT TGCTGATATG 
CTACGTGCAG AACCTGAGCA TTATCTTGCG TTACCGGACT TTTATCGCCA GAAGCGCGAT 
ATTCTGGTGA ATGCTTTAAA TGAAAGCCGG CTGGAGATTT TACCGTGTGA AGGTACATAC 
TTTTTGCTGG TGGATTACAG CGCGGTTTCT ACCCTGGATG ATGTTGAGTT TTGCCAGTGG 
CTGACGCAGG AGCACGGCGT AGCGGCGATT CCGCTGTCGG TGTTTTGCGC CGATCCCTTC 
CCACATAAAC TGATTCGTCT CTGTTTTGCC AAGAAGGAAT CGACGTTGCT GGCAGCAGCT 
GAACGCCTGC GCCAGCTTTA G

Protein sequence

MTNNPLIPQS KLPQLGTTIF TQMSALAQQH QAINLSQGFP DFDGPRYLQE RLAYHVVQGA 
NQYAPMTGVQ ALREAIAQKT ERLYGYQPDA DSDITVTAGA TEALYAAITA LVRNGDEVIC 
FDPSYDSYSP AIALSGGIVK RMALQPPHFR VDWQEFAALL SERTRLVILN TPHNPSATIW 
QQADFAALWQ AIAGHEIFVI SDEVYEHINF SQQGHASVLA HPQLRERAVA VSSFGKTYHM 
TGWKVGYCVA PAPISAEIRK VHQYLTFSVN TPAQLALADM LRAEPEHYLA LPDFYRQKRD 
ILVNALNESR LEILPCEGTY FLLVDYSAVS TLDDVEFCQW LTQEHGVAAI PLSVFCADPF 
PHKLIRLCFA KKESTLLAAA ERLRQL