Gene EcolC_1044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1044
Symbol
ID	6066436
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	1130155
End bp	1131435
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	59%
IMG OID	641600457
Product	4-aminobutyrate aminotransferase
Protein accession	YP_001724040
Protein GI	170019086
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0160] 4-aminobutyrate aminotransferase and related aminotransferases
TIGRFAM ID	[TIGR00700] 4-aminobutyrate aminotransferase, prokaryotic type

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAGCA ATAAAGAGTT AATGCAGCGC CGCAGTCAGG CGATTCCCCG TGGTGTTGGG 
CAAATTCACC CGATTTTCGC TGACCGCGCG GAAAACTGCC GGGTGTGGGA CGTTGAAGGC 
CGTGAGTATC TTGATTTCGC GGGCGGGATT GCGGTGCTCA ATACCGGGCA CTTGCATCCG 
AAAGTGGTGG CTGCGGTGGA AGCGCAGTTG AAAAAACTGT CGCACACCTG CTTCCAGGTG 
CTGGCCTACG AGCCGTATCT GGAGCTGTGC GAGATTATGA ATCAGAAGGT GCCAGGCAAT 
TTTGCCAAGA AAACGCTGCT GGTCACCACA GGTTCTGAAG CGGTGGAAAA CGCGGTGAAA 
ATCGCCCGCG CCGCCACCAA ACGTAGCGGC ACCATCGCTT TTAGCGGCGC GTATCACGGG 
CGCACGCATT ACACGCTGGC GCTGACCGGC AAGGTGAATC CGTACTCTGC GGGCATGGGG 
CTGATGCCGG GTCATGTTTA TCGCGCGCTT TATCCTTGCC CGCTGCACGG CATAAGCGAG 
GATGACGCTA TCGCCAGCAT CCACCGGATC TTCAAAAATG ATGCCGCGCC GGAAGATATC 
GCCGCCATCG TGATTGAGCC GGTTCAGGGC GAAGGCGGTT TCTACGCCTC GTCGCCAGCC 
TTTATGCAGC GTTTACGCGC TCTGTGTGAC GAGCACGGGA TCATGCTGAT TGCCGATGAA 
GTGCAGAGCG GCGCGGGGCG TACCGGCACG CTGTTTGCGA TGGAGCAGAT GGGCGTTGCG 
CCGGATCTTA CCACCTTTGC GAAATCGATC GCGGGCGGCT TCCCGCTGGC GGGCGTCACC 
GGGCGCGCGG AAGTAATGGA TGCCGTCGCT CCAGGCGGTC TGGGCGGCAC CTATGCGGGT 
AACCCGATTG CCTGCGTGGC TGCGCTGGAA GTGTTGAAGG TGTTTGAGCA GGAAAATCTG 
CTGCAAAAAG CCAACGATCT GGGGCAGAAG TTGAAAGACG GATTGCTGGC GATAGCCGAA 
AAACACCCGG AGATCGGCGA CGTACGCGGG CTGGGGGCGA TGATCGCCAT TGAGCTGTTT 
GAAGACGGCG ATCACAACAA GCCGGACGCC AAACTCACCG CCGAGATCGT GGCTCGCGCC 
CGCGATAAAG GCCTGATTCT TCTCTCCTGC GGCCCGTATT ACAACGTGCT GCGCATCCTT 
GTACCGCTCA CCATTGAAGA CGCTCAGATC CGTCAGGGTC TGGAGATCAT CAGCCAGTGT 
TTTGATGAGG CGAAGCAGTA G

Protein sequence

MSSNKELMQR RSQAIPRGVG QIHPIFADRA ENCRVWDVEG REYLDFAGGI AVLNTGHLHP 
KVVAAVEAQL KKLSHTCFQV LAYEPYLELC EIMNQKVPGN FAKKTLLVTT GSEAVENAVK 
IARAATKRSG TIAFSGAYHG RTHYTLALTG KVNPYSAGMG LMPGHVYRAL YPCPLHGISE 
DDAIASIHRI FKNDAAPEDI AAIVIEPVQG EGGFYASSPA FMQRLRALCD EHGIMLIADE 
VQSGAGRTGT LFAMEQMGVA PDLTTFAKSI AGGFPLAGVT GRAEVMDAVA PGGLGGTYAG 
NPIACVAALE VLKVFEQENL LQKANDLGQK LKDGLLAIAE KHPEIGDVRG LGAMIAIELF 
EDGDHNKPDA KLTAEIVARA RDKGLILLSC GPYYNVLRIL VPLTIEDAQI RQGLEIISQC 
FDEAKQ