Gene EcolC_1068 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1068
Symbol
ID	6065877
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	1159560
End bp	1161221
Gene Length	1662 bp
Protein Length	553 aa
Translation table	11
GC content	52%
IMG OID	641600480
Product	recombination and repair protein
Protein accession	YP_001724062
Protein GI	170019108
COG category	[L] Replication, recombination and repair
COG ID	[COG0497] ATPase involved in DNA repair
TIGRFAM ID	[TIGR00634] DNA repair protein RecN

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0569436
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.137036
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGGCAC AACTGACCAT CAGCAACTTT GCTATCGTTC GTGAGCTTGA GATTGATTTT 
CATAGCGGCA TGACCGTAAT AACTGGCGAG ACCGGCGCGG GTAAATCTAT TGCAATAGAT 
GCCCTCGGTC TTTGTCTCGG TGGTCGCGCT GAAGCCGACA TGGTGCGTAC CGGCGCTGCT 
CGCGCTGACC TGTGCGCCCG TTTTTCTCTG AAAGATACGC CAGCGGCTCT GCGCTGGCTG 
GAAGAAAACC AGCTTGAAGA CGGGCATGAA TGTTTGCTTC GTCGCGTGAT CAGCAGCGAT 
GGTCGCTCCC GTGGTTTCAT CAACGGTACA GCTGTTCCTC TGTCACAACT GCGCGAACTG 
GGTCAGTTGC TGATTCAGAT CCATGGTCAG CACGCTCATC AATTACTCAC CAAACCTGAG 
CACCAAAAAT TCCTGCTTGA TGGCTATGCC AATGAAACCT CTCTACTGCA GGAAATGACC 
GCACGTTATC AGTTGTGGCA TCAAAGCTGC CGTGACCTCG CGCATCATCA ACAGTTAAGT 
CAGGAACGCG CCGCCCGTGC GGAACTGCTG CAATACCAAT TAAAAGAACT TAACGAATTT 
AATCCGCAGC CCGGAGAGTT TGAACAAATC GACGAAGAGT ACAAACGTCT GGCGAACAGC 
GGTCAATTGC TGACCACCAG CCAGAATGCA TTGGCATTAA TGGCCGACGG TGAAGACGCA 
AACCTGCAAA GTCAGCTTTA CACGGCTAAA CAACTGGTGA GCGAATTGAT TGGCATGGAC 
AGCAAACTGT CCGGCGTACT TGATATGCTG GAAGAAGCTA CCATCCAGAT TGCTGAAGCC 
AGCGATGAAC TGCGCCACTA CTGCGATCGT CTGGATCTCG ATCCCAACCG ACTATTTGAA 
CTTGAACAGC GCATCTCAAA ACAGATTTCG CTGGCACGTA AACATCACGT CAGCCCTGAG 
GCATTGCCAC AGTATTACCA GTCGCTACTG GAAGAACAGC AGCAACTGGA CGATCAGGCC 
GACTCACAAG AAACGCTTGC GCTGGCGGTA ACGAAACATC ATCAGCAGGC ACTGGAAATC 
GCGCGCGCAT TACACCAACA ACGCCAGCAA TATGCAGAAG AACTTGCACA GCTGATCACC 
GACAGTATGC ATGCGCTCTC AATGCCGCAT GGGCAGTTTA CGATCGATGT TAAATTTGAC 
GAGCATCACC TGGGCGCTGA CGGTGCCGAT CGTATTGAGT TTCGGGTAAC CACCAACCCA 
GGTCAGCCAA TGCAGCCTAT TGCCAAAGTC GCATCCGGTG GTGAATTGTC CCGCATCGCA 
CTGGCAATCC AGGTCATCAC GGCGCGTAAA ATGGAAACCC CGGCACTGAT TTTTGATGAA 
GTGGATGTAG GGATTAGCGG TCCAACAGCG GCAGTTGTCG GCAAACTGCT GCGTCAACTC 
GGCGAATCAA CTCAGGTGAT GTGTGTTACC CACCTGCCAC AAGTCGCGGG ATGTGGTCAT 
CAACACTATT TTGTCAGCAA AGAAACCGAT GGTGCGATGA CAGAAACGCA TATGCAATCC 
CTGAATAAAA AAGCGCGGTT ACAAGAGCTG GCGCGCCTGC TTGGTGGCAG TGAAGTCACA 
CGTAATACAC TGGCGAATGC GAAAGAACTG CTTGCAGCGT AA

Protein sequence

MLAQLTISNF AIVRELEIDF HSGMTVITGE TGAGKSIAID ALGLCLGGRA EADMVRTGAA 
RADLCARFSL KDTPAALRWL EENQLEDGHE CLLRRVISSD GRSRGFINGT AVPLSQLREL 
GQLLIQIHGQ HAHQLLTKPE HQKFLLDGYA NETSLLQEMT ARYQLWHQSC RDLAHHQQLS 
QERAARAELL QYQLKELNEF NPQPGEFEQI DEEYKRLANS GQLLTTSQNA LALMADGEDA 
NLQSQLYTAK QLVSELIGMD SKLSGVLDML EEATIQIAEA SDELRHYCDR LDLDPNRLFE 
LEQRISKQIS LARKHHVSPE ALPQYYQSLL EEQQQLDDQA DSQETLALAV TKHHQQALEI 
ARALHQQRQQ YAEELAQLIT DSMHALSMPH GQFTIDVKFD EHHLGADGAD RIEFRVTTNP 
GQPMQPIAKV ASGGELSRIA LAIQVITARK METPALIFDE VDVGISGPTA AVVGKLLRQL 
GESTQVMCVT HLPQVAGCGH QHYFVSKETD GAMTETHMQS LNKKARLQEL ARLLGGSEVT 
RNTLANAKEL LAA