Gene EcolC_3527 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3527
Symbol
ID	6065550
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	3851713
End bp	3852615
Gene Length	903 bp
Protein Length	300 aa
Translation table	11
GC content	49%
IMG OID	641602944
Product	putative transposase YhgA family protein
Protein accession	YP_001726468
Protein GI	170021514
COG category	[S] Function unknown
COG ID	[COG5464] Uncharacterized conserved protein
TIGRFAM ID	[TIGR01784] conserved hypothetical protein (putative transposase or invertase)

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.653665
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGCAC CGAGTACCAC ACCGCATGAC GCGGTATTTA AACAATTTTT AATGCATGCG 
GAGACGGCTC GCGACTTTCT GGAGATACAT TTGCCAGTGG AATTACGCGA ACTTTGTGAC 
CTCAACACGC TTCATTTAGA GTCGGGGAGT TTCATTGAAG AGAGCCTGAA AGGACACAGC 
ACGGACGTGC TCTATTCCGT GCAAATGCAG GGCAATCCCG GTTATCTGCA TGTTGTGATT 
GAACACCAAA GCAAGCCGGA TAAGAAAATG GCCTTTCGCA TGATGCGTTA TTCTATAGCC 
GCCATGCACC GGCATCTGGA GGCTGACCAC GATAAGCTGC CGCTGGTGGT GCCGATACTG 
TTTTATCAGG GCGAGGCCAC ACCTTATCCG CTATCAATGT GCTGGTTTGA TATGTTTTAC 
TCGCCGGAGC TGGCGCGACG CGTCTATAAC AGTCCTTTCC CGCTGGTGGA TATCACCATC 
ACACCGGATG ACGAAATCAT GCAACATCGG CGGATTGCGA TTCTCGAACT ACTGCAAAAA 
CATATTCGCC AGCGCGACTT AATGTTATTG CTTGAGCAAC TGGTCACGCT GATCGACGAA 
GGGTACACTA GCGGAAGTCA GTTAGTTGCC ATGCAAAACT ATATGCTGCA ACGCGGTCAT 
ACTGAACAAG CGGATTTGTT TTACGGTGTG TTGAGAGACA GGGAAACGGG AGGGGAGTCT 
ATGATGACGC TGGCGCAGTG GTTTGAAGAG AAAGGGATTG AGAAGGGGAT TCAGCAGGGA 
AGACAGGAAG TAAGTCAGGA ATTCGCCCAG CGTCTTCTGA GTAAAGGAAT GTCTCGGGAA 
GACGTTGCAG AGATGGCAAA TTTACCTCTT GCTGAGATTG ATAAGGTAAT TAACCTTATT 
TAA

Protein sequence

MDAPSTTPHD AVFKQFLMHA ETARDFLEIH LPVELRELCD LNTLHLESGS FIEESLKGHS 
TDVLYSVQMQ GNPGYLHVVI EHQSKPDKKM AFRMMRYSIA AMHRHLEADH DKLPLVVPIL 
FYQGEATPYP LSMCWFDMFY SPELARRVYN SPFPLVDITI TPDDEIMQHR RIAILELLQK 
HIRQRDLMLL LEQLVTLIDE GYTSGSQLVA MQNYMLQRGH TEQADLFYGV LRDRETGGES 
MMTLAQWFEE KGIEKGIQQG RQEVSQEFAQ RLLSKGMSRE DVAEMANLPL AEIDKVINLI