Gene EcolC_0936 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0936
Symbol
ID	6068482
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	1017271
End bp	1018383
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	52%
IMG OID	641600344
Product	transposase IS4 family protein
Protein accession	YP_001723932
Protein GI	170018978
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00116007
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATTACT CTCACGATAA CTGGTCAGCA ATTCTGGCCC ATATTGGTAA GCCCGAAGAA 
CTGGATACTT CGGCACGTAA TGCCGGGGCT CTAACCCGCC GCCGCGAAAT TCGTGATGCT 
GCAACTCTGC TACGTCTGGG GCTGGCTTAC GGCCCCGGGG GGATGTCATT ACGTGAAGTC 
ACTGCATGGG CTCAGCTCCA TGACGTTGCA ACATTATCTG ACGTGGCTCT CCTGAAGCGG 
CTGCGGAATG CCGCCGACTG GTTTGGCATA CTTGCCGCAC AAACACTTGC TGTACGCGCC 
GCAGTTACGG GTTGTACAAG CGGAAAGAGA TTGCGTCTTG TCGATGGAAC AGCAATCAGT 
GCGCCCGGGG GCGGCAGCGC TGAATGGCGA CTACATATGG GATATGATCC TCATACCTGT 
CAGTTCACTG ATTTTGAGCT AACCGACAGC AGAGACGCTG AACGGCTGGA CCGATTTGCG 
CAAACGGCAG ACGAGATACG CATTGCTGAC CGGGGATTCG GTTCGCGTCC CGAATGTATC 
CGCTCACTTG CTTTTGGAGA AGCTGATTAT ATCGTCCGGG TTCACTGGCG AGGATTGCGC 
TGGTTAACTG CAGAAGGAAT GCGCTTTGAC ATGATGGGTT TTCTGCGCGG GCTGGATTGC 
GGTAAGAACG GTGAAACCAC TGTAATGATA GGCAATTCAG GTAATAAAAA AGCCGGAGCT 
CCCTTTCCGG CACGTCTCAT TGCCGTATCA CTTCCTCCCG AAAAAGCATT AATCAGTAAA 
ACCCGACTGC TCAGCGAGAA TCGTCGAAAA GGACGAGTAG TTCAGGCGGA AACGCTGGAA 
GCAGCGGGCC ATGTGCTATT GCTAACATCA TTACCGGAAG ATGAATATTC AGCAGAGCAA 
GTGGCTGATT GTTACCGTCT GCGATGGCAA ATTGAACTGG CTTTTAAGCG GCTCAAAAGT 
TTGCTGCACC TGGATGCTTT GCGTGCAAAG GAACCTGAAC TCGCGAAAGC GTGGATATTT 
GCTAATCTAC TCGCCGCATT TTTAATTGAC GACATAATCC AGCCATCGCT GGATTTCCCC 
CCCAGAAGTG CCGGATCCGA AAAGAAGAAC TAA

Protein sequence

MNYSHDNWSA ILAHIGKPEE LDTSARNAGA LTRRREIRDA ATLLRLGLAY GPGGMSLREV 
TAWAQLHDVA TLSDVALLKR LRNAADWFGI LAAQTLAVRA AVTGCTSGKR LRLVDGTAIS 
APGGGSAEWR LHMGYDPHTC QFTDFELTDS RDAERLDRFA QTADEIRIAD RGFGSRPECI 
RSLAFGEADY IVRVHWRGLR WLTAEGMRFD MMGFLRGLDC GKNGETTVMI GNSGNKKAGA 
PFPARLIAVS LPPEKALISK TRLLSENRRK GRVVQAETLE AAGHVLLLTS LPEDEYSAEQ 
VADCYRLRWQ IELAFKRLKS LLHLDALRAK EPELAKAWIF ANLLAAFLID DIIQPSLDFP 
PRSAGSEKKN