Gene ECD_02947 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_02947
Symbol	ygjI
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	+
Start bp	3092316
End bp	3093749
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	50%
IMG OID
Product	predicted transporter
Protein accession	ACT44751
Protein GI	253979081
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGATA CCAAACGTAA TACAATCGGC AAATTCGGCT TGCTCTCGCT GACTTTTGCC 
GCCGTTTACA GCTTTAACAA CGTTATCAAT AATAATATTG AGCTTGGACT GGCCTCGGCA 
CCGATGTTTT TCCTCGCGAC GATTTTTTAT TTTATTCCCT TCTGTCTGAT CATCGCAGAA 
TTTGTTTCGT TAAATAAAAA CTCAGAAGCC GGTGTCTACG CGTGGGTAAA AAGTTCGCTG 
GGCGGACGTT GGGCATTTAT TACTGCCTAT ACCTACTGGT TCGTAAACCT GTTCTTTTTC 
ACCTCACTGT TGCCGCGCGT TATTGCTTAT GCTTCGTATG CCTTCCTCGG ATACGAATAT 
ATTATGACGC CGGTTGCCAC CACCATTATC AGTATGGTGC TGTTCGCCTT CTCCACCTGG 
GTTTCCACCA ACGGGGCGAA AATGTTGGGG CCAATTACCT CCGTCACTTC AACGCTGATG 
CTGCTGTTAA CGCTCTCCTA CATTTTACTG GCAGGTACGG CGCTGGTTGG CGGCGTACAG 
CCTGCTGACG CCATCACCGT TGACGCGATG ATCCCGAACT TCAACTGGGC GTTCCTCGGC 
GTTACCACCT GGATCTTTAT GGCCGCAGGT GGCGCGGAGT CCGTCGCTGT GTACGTTAAC 
GACGTCAAAG GCGGTTCGAA ATCGTTCGTT AAAGTGATCA TCCTCGCCGG GATTTTTATC 
GGCGTACTGT ATTCCGTCTC CTCGGTGCTG ATTAACGTCT TCGTCAGCAG CAAAGAGTTG 
AAATTTACCG GCGGATCGGT GCAGGTATTC CACGGCATGG CGGCGTATTT TGGTCTACCG 
GAAGCGTTGA TGAATCGCTT TGTCGGTCTG GTGTCCTTTA CCGCGATGTT CGGTTCCCTG 
CTGATGTGGA CCGCAACGCC GGTGAAAATT TTCTTCTCCG AAATCCCGGA AGGCATCTTT 
GGTAAGAAAA CCGTCGAACT GAACGAAAAC GGCGTTCCGG CGCGCGCAGC GTGGATCCAG 
TTCCTGATCG TCATCCCGCT GATGATTATC CCGATGCTCG GTTCCAATAC CGTGCAGGAT 
CTGATGAATA CTATTATTAA TATGACCGCC GCAGCGTCCA TGCTTCCGCC GTTATTCATC 
ATGCTGGCTT ACCTGAATTT ACGCGCCAAA TTAGATCACC TGCCACGCGA TTTCCGTATG 
GGCTCCCGCC GCACCGGTAT TATCGTTGTT TCAATGCTGA TTGCGATATT TGCCGTAGGG 
TTTGTCGCTT CGACATTCCC GACTGGCGCG AATATTCTGA CCATCATTTT TTATAACGTC 
GGCGGTATTG TTATCTTCCT TGGCTTTGCG TGGTGGAAAT ACAGTAAATA TATAAAGGGA 
TTAACGGCTG AAGAGCGCCA TATTGAAGCG ACGCCAGCCA GCAATGTTGA TTAA

Protein sequence

MSDTKRNTIG KFGLLSLTFA AVYSFNNVIN NNIELGLASA PMFFLATIFY FIPFCLIIAE 
FVSLNKNSEA GVYAWVKSSL GGRWAFITAY TYWFVNLFFF TSLLPRVIAY ASYAFLGYEY 
IMTPVATTII SMVLFAFSTW VSTNGAKMLG PITSVTSTLM LLLTLSYILL AGTALVGGVQ 
PADAITVDAM IPNFNWAFLG VTTWIFMAAG GAESVAVYVN DVKGGSKSFV KVIILAGIFI 
GVLYSVSSVL INVFVSSKEL KFTGGSVQVF HGMAAYFGLP EALMNRFVGL VSFTAMFGSL 
LMWTATPVKI FFSEIPEGIF GKKTVELNEN GVPARAAWIQ FLIVIPLMII PMLGSNTVQD 
LMNTIINMTA AASMLPPLFI MLAYLNLRAK LDHLPRDFRM GSRRTGIIVV SMLIAIFAVG 
FVASTFPTGA NILTIIFYNV GGIVIFLGFA WWKYSKYIKG LTAEERHIEA TPASNVD