Gene EcolC_1943 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1943
Symbol
ID	6068531
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	2146505
End bp	2147617
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	55%
IMG OID	641601355
Product	putative inner membrane protein
Protein accession	YP_001724916
Protein GI	170019962
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.000987664
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGTAAATG TTCGTCAGCC CAGGGATGTC GCACAAATTC TGCTTTCGGT GCTGTTTTTA 
GCCATCATGA TTGTGGCATG TCTGTGGATT GTTCAACCCT TTATTCTCGG CTTTGCATGG 
GCCGGTACGG TGGTTATCGC CACCTGGCCG GTATTGTTAC GTTTGCAAAA GATCATGTTT 
GGCCGCCGCT CTCTCGCCGT TCTGGTGATG ACGCTGTTAT TAGTGATGGT GTTTATCATC 
CCTATTGCTT TGCTGGTTAA CAGTATCGTC GACGGCAGCG GCCCGCTAAT TAAAGCCATT 
TCCAGCGGTG ACATGACGTT ACCCGATCTG GCGTGGCTTA ATACCATTCC GGTGATTGGC 
GCGAAGCTGT ATGCAGGCTG GCACAACTTG CTGGATATGG GGGGGACGGC GATCATGGCG 
AAAGTCCGCC CTTATATTGG CACCACCACC ACCTGGTTCG TTGGGCAAGC GGCGCATATC 
GGGCGCTTTA TGGTGCATTG TGCGCTGATG CTTCTCTTCA GTGCCCTGCT GTACTGGCGC 
GGTGAACAGG TGGCACAAGG CATTCGCCAT TTTGCGACCC GTCTGGCAGG CGTTCGCGGA 
GATGCCGCCG TACTGCTGGC GGCACAGGCT ATCCGCGCGG TGGCGCTGGG TGTGGTGGTG 
ACGGCGTTAG TACAGGCAGT GCTTGGCGGT ATCGGCCTCG CCGTTTCCGG CGTACCTTAT 
GCAACTTTGC TAACGGTGTT AATGATCCTC TCCTGCCTTG TCCAGCTTGG CCCGTTGCCG 
GTACTGATTC CGGCGATTAT CTGGCTCTAC TGGACCGGCG ATACCACCTG GGGAACGGTA 
TTGTTAGTGT GGAGCGGTGT GGTTGGCACG CTGGATAACG TCATCCGCCC AATGTTAATT 
CGCATGGGTG CCGATTTACC GCTGATCCTG ATCCTCTCTG GCGTTATTGG TGGTTTGATT 
GCTTTCGGGA TGATCGGTCT GTTTATTGGT CCGGTTCTGT TAGCCGTTTC CTGGCGTCTG 
TTTGCCGCGT GGGTGGAAGA AGTCCCGCCG CCGACGGACC AACCGGAAGA AATTCTCGAA 
GAACTTGGCG AAATCGAGAA ACCGAATAAG TAA

Protein sequence

MVNVRQPRDV AQILLSVLFL AIMIVACLWI VQPFILGFAW AGTVVIATWP VLLRLQKIMF 
GRRSLAVLVM TLLLVMVFII PIALLVNSIV DGSGPLIKAI SSGDMTLPDL AWLNTIPVIG 
AKLYAGWHNL LDMGGTAIMA KVRPYIGTTT TWFVGQAAHI GRFMVHCALM LLFSALLYWR 
GEQVAQGIRH FATRLAGVRG DAAVLLAAQA IRAVALGVVV TALVQAVLGG IGLAVSGVPY 
ATLLTVLMIL SCLVQLGPLP VLIPAIIWLY WTGDTTWGTV LLVWSGVVGT LDNVIRPMLI 
RMGADLPLIL ILSGVIGGLI AFGMIGLFIG PVLLAVSWRL FAAWVEEVPP PTDQPEEILE 
ELGEIEKPNK