Gene EcolC_1953 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1953
Symbol
ID	6068429
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	2157966
End bp	2158970
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	52%
IMG OID	641601365
Product	ErfK/YbiS/YcfS/YnhG family protein
Protein accession	YP_001724926
Protein GI	170019972
COG category	[S] Function unknown
COG ID	[COG1376] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00000819451
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.0000000126491
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGAAACGCG CGTCTTTGCT TACACTCACG CTTATCGGCG CTTTTAGCGC CATCCAGGCT 
GCCTGGGCGG TTGATTATCC GCTACCACCA ACCGGAAGCC GACTGGTTGG GCAAAATCAA 
ACGTATACGG TGCAAGAAGG GGATAAAAAC CTTCAGGCTA TTGCCCGACG TTTTGATACT 
GCGGCAATGT TGATCCTTGA AGCCAATAAC ACTATCGCCC CGGTGCCAAA ACCTGGTACG 
ACGATAACTA TTCCTTCACA ACTGTTATTA CCTGATGCAC CGCGTCAGGG GATTATCGTT 
AACCTTGCAG AGCTGCGCCT TTATTATTAT CCGCCGGGAG AAAATATTGT GCAGGTTTAT 
CCAATAGGTA TTGGATTGCA GGGGCTGGAA ACGCCGGTGA TGGAAACGCG TGTTGGGCAG 
AAAATCCCTA ACCCAACCTG GACGCCTACG GCAGGCATTC GTCAGCGTTC GCTGGAGCGT 
GGCATTAAAT TACCGCCAGT CGTTCCTGCC GGACCAAATA ACCCGCTAGG ACGTTACGCA 
CTGCGCCTCG CGCATGGTAA TGGCGAATAC CTCATTCATG GTACCAGTGC GCCGGACAGC 
GTCGGTTTGC GCGTCAGTTC AGGGTGTATT CGCATGAATG CACCGGATAT TAAAGCCTTG 
TTCTCCAGCG TGCGGACGGG AACGCCGGTG AAAGTGATCA ACGAACCGGT GAAATATTCC 
GTGGAGCCTA ACGGGATGCG TTATGTTGAA GTACATCGAC CACTATCGGC AGAAGAACAG 
CAGAACGTTC AGACAATGCC ATACACACTG CCAGCAGGCT TTACGCAATT TAAAGACAAT 
AAGGCTGTAG ATCAGAAGTT AGTCGATAAA GCGTTGTATC GTCGGGCAGG GTATCCGGTT 
TCGGTGAGCA GTGGAGCAAC TCCCGCAGCC AGCAATGCGC CTTCAGTAGA GTCAGCGCAG 
AATGGTGAAC CAGAGCAAGG GAATATGTTA CGCGTGACGC AGTAG

Protein sequence

MKRASLLTLT LIGAFSAIQA AWAVDYPLPP TGSRLVGQNQ TYTVQEGDKN LQAIARRFDT 
AAMLILEANN TIAPVPKPGT TITIPSQLLL PDAPRQGIIV NLAELRLYYY PPGENIVQVY 
PIGIGLQGLE TPVMETRVGQ KIPNPTWTPT AGIRQRSLER GIKLPPVVPA GPNNPLGRYA 
LRLAHGNGEY LIHGTSAPDS VGLRVSSGCI RMNAPDIKAL FSSVRTGTPV KVINEPVKYS 
VEPNGMRYVE VHRPLSAEEQ QNVQTMPYTL PAGFTQFKDN KAVDQKLVDK ALYRRAGYPV 
SVSSGATPAA SNAPSVESAQ NGEPEQGNML RVTQ