Gene EcolC_3043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3043
Symbol
ID	6065622
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	3322490
End bp	3323650
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	54%
IMG OID	641602459
Product	putative aminotransferase
Protein accession	YP_001725994
Protein GI	170021040
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAAATA ACCCTCTGAT TCCACAAAGC AAACTTCCAC AACTTGGCAC CACTATTTTC 
ACCCAGATGA GCGCGCTGGC GCAGCAACAC CAGGCGATTA ACCTGTCGCA AGGCTTTCCT 
GATTTTGATG GTCCGCGCTA TTTACAGGAG CGGCTGGCGC ACCACGTTGC ACAGGGGGCA 
AACCAATACG CGCCCATGAC CGGCGTGCAG GCCTTGCGCG AGGCGATTGC TCAGAAAACG 
GAACGTTTGT ATGGCTATCA ACCAGATGCC GATAGCGATA TCACCGTAAC GGCAGGGGCG 
ACGGAAGCGT TATACGCGGC GATTACCGCA CTGGTGCGCA ATGGCGATGA AGTGATTTGT 
TTTGATCCCA GCTATGACAG TTACGCCCCC GCCATCGCGC TTTCTGGGGG AATAGTGAAG 
CGTATGGCAC TGCAACCACC GCATTTTCGC GTTGACTGGC AGGAATTTGC CGCATTATTA 
AGCGAGCGCA CCAGACTGGT GATCCTCAAC ACTCCGCATA ACCCCAGTGC AACTGTCTGG 
CAGCAGGCTG ATTTCGCCGC TTTGTGGCAG GCGATCGCCG GGCACGAGAT TTTTGTCATT 
AGCGATGAAG TCTACGAGCA CATCAACTTT TCACAACAGG GCCATGCCAG TGTGCTGGCG 
CATCCGCAGC TGCGTGAGCG GGCAGTGGCG GTTTCTTCAT TTGGCAAGAC CTATCATATG 
ACCGGCTGGA AAGTGGGTTA TTGTGTTGCG CCAGCGCCCA TCAGCGCCGA AATTCGCAAG 
GTACATCAGT ATCTGACCTT TTCGGTGAAT ACCCCGGCAC AGCTGGCGCT TGCTGATATG 
CTACGTGCAG AGCCTGAGCA TTATCTTGCG TTACCGGACT TTTATCGCCA GAAGCGCGAT 
ATTCTGGTGA ATGCTTTAAA TGAAAGCCGG CTGGAGATTT TACCGTGTGA AGGTACATAC 
TTTTTGCTGG TGGATTACAG CGCGGTTTCT ACCCTGGATG ATGTTGAGTT TTGCCAGTGG 
CTGACGCAGG AGCACGGCGT AGCGGCGATT CCGCTGTCGG TGTTTTGCGC CGATCCCTTC 
CCACATAAAC TGATTCGTCT CTGTTTTGCC AAGAAGGAAT CGACGTTGCT GGCAGCAGCT 
GAACGCCTGC GCCAGCTTTA G

Protein sequence

MTNNPLIPQS KLPQLGTTIF TQMSALAQQH QAINLSQGFP DFDGPRYLQE RLAHHVAQGA 
NQYAPMTGVQ ALREAIAQKT ERLYGYQPDA DSDITVTAGA TEALYAAITA LVRNGDEVIC 
FDPSYDSYAP AIALSGGIVK RMALQPPHFR VDWQEFAALL SERTRLVILN TPHNPSATVW 
QQADFAALWQ AIAGHEIFVI SDEVYEHINF SQQGHASVLA HPQLRERAVA VSSFGKTYHM 
TGWKVGYCVA PAPISAEIRK VHQYLTFSVN TPAQLALADM LRAEPEHYLA LPDFYRQKRD 
ILVNALNESR LEILPCEGTY FLLVDYSAVS TLDDVEFCQW LTQEHGVAAI PLSVFCADPF 
PHKLIRLCFA KKESTLLAAA ERLRQL