Gene ECH74115_3856 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3856
Symbol	recN
ID	6970748
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	3575912
End bp	3577573
Gene Length	1662 bp
Protein Length	553 aa
Translation table	11
GC content	52%
IMG OID	643387636
Product	recombination and repair protein
Protein accession	YP_002272085
Protein GI	209397502
COG category	[L] Replication, recombination and repair
COG ID	[COG0497] ATPase involved in DNA repair
TIGRFAM ID	[TIGR00634] DNA repair protein RecN

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00344363
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGGCAC AACTGACCAT CAGCAACTTT GCTATCGTTC GTGAGCTTGA GATTGATTTT 
CATAGCGGCA TGACCGTAAT AACTGGCGAA ACCGGTGCGG GTAAATCTAT TGCAATAGAT 
GCCCTCGGTC TTTGTCTCGG TGGTCGCGCT GAAGCCGACA TGGTGCGTAC CGGCGCTGCT 
CGCGCTGACC TGTGCGCCCG TTTTTCTCTG AAAGATACGC CAGCGGCCCT GCGCTGGCTG 
GAAGAAAACC AGCTTGAAGA CGGGCATGAA TGTTTGCTTC GTCGCGTGAT CAGCAGCGAT 
GGTCGCTCCC GTGGTTTCAT CAACGGTACA GCTGTTCCTC TGTCACAACT GCGCGAACTG 
GGTCAGTTGC TGATTCAGAT CCATGGTCAG CACGCTCATC AGTTACTCAC CAAACCCGAG 
CACCAAAAAT TCCTGCTTGA TGGCTATGCC AATGAAACCT CTCTACTCCA GGAAATGACC 
GCACGTTATC AGTTGTGGCA TCAAAGCTGC CGTGACCTCG CGCATCATCA ACAGTTAAGT 
CAGGAACGCG CTGCCCGTGC GGAACTGCTG CAATACCAAT TAAAAGAACT TAACGAATTT 
AATCCGCAGC CCGGAGAGTT TGAGCAAATC GACGAAGAGT ACAAACGTCT GGCGAACAGC 
GGTCAATTGC TGACCACCAG CCAGAATGCA TTGGCATTAA TGGCCGACGG TGAAGACGCA 
AACCTGCAAA GTCAGCTTTA CACGGCTAAA CAACTGGTGA GCGAATTGAT TGGCATGGAC 
AGCAAACTGT CCGGCGTACT TGATATGCTG GAAGAAGCTA CCATCCAGAT TGTTGAAGCC 
AGCGACGAAC TGCGCCACTA CTGCGATCGT CTGGATCTCG ATCCCAACCG ACTGTTTGAA 
CTTGAACAGC GCATCTCAAA ACAGATTTCG CTGGCACGTA AACATCACGT CAGCCCTGAG 
ACATTGCCAC AGTATTACCA GTCGCTACTG GAAGAACAGC AGCAACTGGA CGATCAGGCC 
GACTCACAAG AAACGCTCGC ACTGGCGGTA ACGAAACATC ATCAGCAGGC ACTGGAAACG 
GCGCGCGCAT TACACCAGCA ACGCCAGCAT TATGCAGAAG AACTTGCACA GCTGATCACC 
GACAGTATGC ATGCGCTCTC AATGCCGCAT GGGCAGTTTA CGATTGATGT CAAATTTGAC 
GAGCATCACC TGGGCGCTGA CGGCGCCGAT CGTATTGAGT TTCGGGTAAC CACCAACCCA 
GGTCAGCCAA TGCAGCCTAT TGCCAAAGTC GCATCCGGTG GTGAATTGTC CCGCATCGCA 
TTGGCAATTC AGGTCATCAC GGCGCGTAAA ATGGAAACCC CGGCACTGAT TTTTGATGAA 
GTGGATGTAG GGATTAGCGG TCCAACAGCG GCAGTTGTCG GCAAACTGCT GCGTCAACTC 
GGCGAATCAA CTCAGGTGAT GTGTGTTACC CACCTGCCAC AAGTCGCGGG ATGTGGTCAT 
CAACACTATT TTGTCAGCAA AGAAACCGAT GGTGCGATGA CAGAAACGCA TATGCAATCC 
CTGAATAAAA AAACGCGGTT ACAAGAGCTG GCGCGCCTGC TTGGTGGCAG TGAAGTCACA 
CGTAACACAC TGGCGAATGC GAAAGAACTG CTTGCGGCGT AA

Protein sequence

MLAQLTISNF AIVRELEIDF HSGMTVITGE TGAGKSIAID ALGLCLGGRA EADMVRTGAA 
RADLCARFSL KDTPAALRWL EENQLEDGHE CLLRRVISSD GRSRGFINGT AVPLSQLREL 
GQLLIQIHGQ HAHQLLTKPE HQKFLLDGYA NETSLLQEMT ARYQLWHQSC RDLAHHQQLS 
QERAARAELL QYQLKELNEF NPQPGEFEQI DEEYKRLANS GQLLTTSQNA LALMADGEDA 
NLQSQLYTAK QLVSELIGMD SKLSGVLDML EEATIQIVEA SDELRHYCDR LDLDPNRLFE 
LEQRISKQIS LARKHHVSPE TLPQYYQSLL EEQQQLDDQA DSQETLALAV TKHHQQALET 
ARALHQQRQH YAEELAQLIT DSMHALSMPH GQFTIDVKFD EHHLGADGAD RIEFRVTTNP 
GQPMQPIAKV ASGGELSRIA LAIQVITARK METPALIFDE VDVGISGPTA AVVGKLLRQL 
GESTQVMCVT HLPQVAGCGH QHYFVSKETD GAMTETHMQS LNKKTRLQEL ARLLGGSEVT 
RNTLANAKEL LAA