Gene EcolC_2289 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2289
Symbol	abgT
ID	6065413
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	2526055
End bp	2527581
Gene Length	1527 bp
Protein Length	508 aa
Translation table	11
GC content	49%
IMG OID	641601693
Product	putative aminobenzoyl-glutamate transporter
Protein accession	YP_001725252
Protein GI	170020298
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG2978] Putative p-aminobenzoyl-glutamate transporter
TIGRFAM ID	[TIGR00819] p-Aminobenzoyl-glutamate transporter family

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTATGT CATCCATACC GTCATCCTCC CAATCCGGGA AGCTCTATGG CTGGGTCGAA 
AGAATTGGTA ACAAGGTTCC CCATCCTTTT TTGCTCTTTA TCTATTTGAT TATCGTACTC 
ATGGTGACGA CGGCAATTTT GTCGGCCTTT GGCGTCAGTG CGAAAAACCC GACCGATGGT 
ACGCCGGTCG TGGTGAAAAA CCTGCTCAGT GTGGAAGGAT TACACTGGTT TTTACCCAAT 
GTTATTAAAA ACTTTAGCGG TTTTGCTCCA CTTGGCGCGA TCCTGGCGCT GGTTTTAGGT 
GCCGGTCTGG CGGAGCGCGT CGGCTTACTG CCAGCGCTAA TGGTTAAAAT GGCATCGCAT 
GTTAATGCCC GCTACGCCAG TTATATGGTG CTGTTTATTG CTTTTTTCAG CCACATTTCT 
TCCGATGCGG CGTTAGTGAT CATGCCACCG ATGGGTGCGC TGATTTTTCT GGCGGTGGGC 
AGACATCCAG TTGCAGGTTT ACTGGCCGCC ATTGCAGGCG TAGGTTGCGG CTTTACGGCT 
AATTTACTGA TTGTCACAAC CGACGTGTTG CTGTCGGGGA TCAGCACGGA AGCGGCGGCT 
GCGTTCAATC CGCAAATGCA CGTCAGTGTA ATTGATAACT GGTATTTTAT GGCCAGCTCC 
GTAGTCGTAC TGACGATTGT TGGCGGCCTG ATAACCGACA AAATCATCGA ACCACGGTTA 
GGTCAATGGC AGGGAAACAG CGATGAGAAA CTGCAGACAT TGACCGAAAG TCAGCGTTTT 
GGTTTACGCA TAGCAGGTGT CGTATCGCTA CTTTTTATTG CTGCGATTGC GCTGATGGTG 
ATCCCGGAAA ACGGGATATT GCGCGATCCG ATTAATCACA CCGTGATGCC ATCACCCTTT 
ATTAAAGGTA TCGTGCCACT GATCATTCTT TTTTTCTTTG TGGTCTCGCT GGCTTATGGC 
ATCGCTACTC GCACAATTCG ACGTCAGGCG GATTTACCGC ATTTAATGAT TGAACCGATG 
AAAGAGATGG CGGGATTTAT CGTGATGGTT TTTCCCCTCG CCCAGTTTGT CGCCATGTTT 
AACTGGAGCA ACATGGGGAA ATTCATCGCC GTGGGGCTGA CCGATATACT GGAAAGTTCA 
GGGCTTAGCG GCATCCCGGC GTTTGTCGGT CTGGCGTTGC TTTCCTCTTT CTTATGCATG 
TTTATCGCCA GCGGTTCCGC AATCTGGTCG ATTCTGGCCC CCATTTTCGT ACCAATGTTT 
ATGCTACTTG GCTTTCACCC GGCATTTGCG CAAATCCTCT TTCGTATTGC CGACTCATCC 
GTATTGCCTT TAGCGCCAGT ATCTCCTTTT GTTCCACTGT TTCTTGGATT CCTGCAACGC 
TACAAACCAG ACGCGAAACT GGGTACTTAC TATTCGTTAG TCTTGCCCTA TCCACTTATC 
TTTTTGGTGG TATGGCTGCT GATGTTGCTG GCGTGGTATC TTGTCGGTCT GCCGATAGGT 
CCGGGTATTT ACCCACGTTT GTCTTAA

Protein sequence

MSMSSIPSSS QSGKLYGWVE RIGNKVPHPF LLFIYLIIVL MVTTAILSAF GVSAKNPTDG 
TPVVVKNLLS VEGLHWFLPN VIKNFSGFAP LGAILALVLG AGLAERVGLL PALMVKMASH 
VNARYASYMV LFIAFFSHIS SDAALVIMPP MGALIFLAVG RHPVAGLLAA IAGVGCGFTA 
NLLIVTTDVL LSGISTEAAA AFNPQMHVSV IDNWYFMASS VVVLTIVGGL ITDKIIEPRL 
GQWQGNSDEK LQTLTESQRF GLRIAGVVSL LFIAAIALMV IPENGILRDP INHTVMPSPF 
IKGIVPLIIL FFFVVSLAYG IATRTIRRQA DLPHLMIEPM KEMAGFIVMV FPLAQFVAMF 
NWSNMGKFIA VGLTDILESS GLSGIPAFVG LALLSSFLCM FIASGSAIWS ILAPIFVPMF 
MLLGFHPAFA QILFRIADSS VLPLAPVSPF VPLFLGFLQR YKPDAKLGTY YSLVLPYPLI 
FLVVWLLMLL AWYLVGLPIG PGIYPRLS