Gene EcolC_3750 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3750
Symbol
ID	6068645
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	4102282
End bp	4103364
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	54%
IMG OID	641603165
Product	permease YjgP/YjgQ family protein
Protein accession	YP_001726684
Protein GI	170021730
COG category	[R] General function prediction only
COG ID	[COG0795] Predicted permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00000963246
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAACCTT TTGGCGTACT TGACCGCTAT ATCGGTAAAA CTATTTTCAC CACCATCATG 
ATGACGCTGT TCATGCTGGT GTCGCTGTCG GGCATTATCA AGTTTGTCGA TCAGCTGAAA 
AAAGCCGGGC AGGGGAGTTA CGACGCGTTA GGCGCAGGAA TGTATACCTT GCTGAGCGTG 
CCGAAAGATG TGCAAATCTT CTTCCCGATG GCGGCTCTGC TTGGGGCGTT GCTTGGTCTT 
GGGATGCTGG CGCAGCGCAG CGAACTGGTG GTGATGCAGG CTTCTGGTTT TACCCGTATG 
CAGGTGGCGC TGTCGGTGAT GAAAACCGCC ATTCCGCTGG TCTTACTGAC GATGGCGATT 
GGTGAATGGG TCGCGCCGCA GGGCGAGCAG ATGGCGCGTA ACTACCGTGC GCAGGCGATG 
TACGGCGGCT CGTTGCTCTC TACCCAGCAA GGCTTATGGG CGAAAGATGG CAACAACTTC 
GTCTACATTG AGCGGGTTAA AGGTGACGAA GAGTTAGGTG GCATCAGCAT TTATGCCTTT 
AACGAGAATC GTCGTCTGCA ATCCGTACGC TATGCCGCTA CCGCGAAGTT TGACCCGGAA 
CATAAAGTCT GGCGTCTGTC GCAGGTGGAT GAATCTGATC TGACCAATCC GAAACAGATC 
ACCGGTTCGC AGACGGTGAG CGGTACCTGG AAAACCAACC TCACGCCAGA CAAACTGGGC 
GTGGTGGCGC TGGACCCGGA TGCACTCTCC ATTAGCGGTT TGCACAACTA TGTGAAGTAT 
CTGAAGTCGA GCGGTCAGGA TGCCGGACGT TATCAGCTCA ACATGTGGAG CAAAATCTTC 
CAGCCGCTAT CCGTGGCGGT GATGATGCTG ATGGCGCTGT CGTTCATCTT TGGCCCACTG 
CGTAGCGTAC CGATGGGCGT GCGTGTGGTC ACCGGTATCA GCTTCGGTTT TGTCTTCTAC 
GTACTGGACC AGATCTTCGG CCCGCTGACG TTGGTTTATG GCATCCCGCC GATCATCGGC 
GCACTGTTGC CAAGCGCCAG CTTCTTCTTA ATCAGCCTGT GGCTGTTAAT GAGAAAATCG 
TAA

Protein sequence

MQPFGVLDRY IGKTIFTTIM MTLFMLVSLS GIIKFVDQLK KAGQGSYDAL GAGMYTLLSV 
PKDVQIFFPM AALLGALLGL GMLAQRSELV VMQASGFTRM QVALSVMKTA IPLVLLTMAI 
GEWVAPQGEQ MARNYRAQAM YGGSLLSTQQ GLWAKDGNNF VYIERVKGDE ELGGISIYAF 
NENRRLQSVR YAATAKFDPE HKVWRLSQVD ESDLTNPKQI TGSQTVSGTW KTNLTPDKLG 
VVALDPDALS ISGLHNYVKY LKSSGQDAGR YQLNMWSKIF QPLSVAVMML MALSFIFGPL 
RSVPMGVRVV TGISFGFVFY VLDQIFGPLT LVYGIPPIIG ALLPSASFFL ISLWLLMRKS