Gene EcE24377A_1409 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_1409
Symbol
ID	5587462
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	1412677
End bp	1414197
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	44%
IMG OID	640925104
Product	putative recombinase
Protein accession	YP_001462511
Protein GI	157158350
COG category	[L] Replication, recombination and repair
COG ID	[COG1961] Site-specific recombinases, DNA invertase Pin homologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAAGTG TAATAACATA CTTGAGATTC TCATCAGCCA TACAAGGCGC TGAAGGTGCA 
GATTCAACCA GACGACAAAA TGACCTGTTC AAGCAATGGT TGAAGAAGAA TAGCGATGCT 
CAAGTAGTAG CGTCTTTCAG TGATGAAGGG TTGAGTGGTT ACAAAGGTAA GCATCTTACT 
GGTCAGTTTG GTGACATGTT AGCCCGTATT GAGTCTGGGG AGTTTCCAGA AGGTACACTT 
CTGTTAGTCG AAGCTATCGA CCGCATAGGC CGCCTTGAAC ATCTTGAAAC AGAAGCCTTG 
ATGAATCGCA TTATTGCTCA TGGTATCGAG ATTCACACTC TACAGGATGG GCTAATCTAC 
ACAAGGGATG CTCTATCCGA TGATTTAGGA ATCTCAATCA TCCAGCGCGT TAAAAGCTAC 
GTAGCTCATC AAGAGTCTAA GCAGAAGTCT TTCCGTGTTA GCCAGAAGTG GAAACAACGT 
GCAAAGCTTG CCCTTGCTGG TGAACAACGT TTAACAAAGA TGGTTCCCGG ATGGATTGAC 
CCCGATACTT TTAAACTCAA TGAACACGCT GAGACTGTAA GACTGATTTT CAAGCTGCTG 
CTAAGTGGTG AAAGTCTGCA TAACATCGCC CGTCACCTAC AGGCTAATAA CATTAGTTCA 
TTCTCACGGC GTAAAGATGC TAACGGGTTC AGTGTTCACA GTGTTCGTAC TGTTTTACGC 
TCTGAGTCAG TGATAGGGAC ACTACCAGCA TCACAGCGCA ATGACCGCCC CGCTATACCG 
AACTACTACG AAGCCGCTAT AGATGCTTCA ACGTTCAATA AAGCTCAAGA AATCCTCGAT 
AAAAATCGTA AAGGTCGCAC ACCTGCAAGT GATAACCCAT TAACGATTAA CATCTTCAAG 
GGATTATTCC GGTGTCAGTG TGGGGCTAGT GTTCACCCTA CAGGGACTAA GAATAAGTAT 
GCAGGGGTTT ACAGGTGCAA TAACAATCCT GACGGTCGCT GTGATGTTCC ACCGTTGAAG 
CGTAAACCGT TTGATAAGTG GATGATTGAT AATTTTCTGG GGATGATTGA CGTGGGGAAT 
GATGGAGAAG CAGAGGGGAA GATTGCATCT CTACAGCATG AGGTTGAAAT TGTCACAACC 
AGAATCAAGA AAGCTACCGC CCTACTTCTT GAGATGGATG ATATTACAGA GTTGAAAGCA 
CAGGTGAAGG AACTGAACCA GAAGCGCACA GAACTACAGA CCACGATTGA TAGCATGAGG 
CGTAAAACTT CACTCAGTGA CAAGGGATTA CCCCAACTCA AAGACATTGA CCTTATGACT 
AAAGCGGGTC GTGTTGAGTG TCAGTTGATT CTGTCCAAGC ATCTAAAAGG GCTTACATTG 
GGTAAGGATT CGGTAACTGT AACGCTACAG AACGACACTG AAATAATTGT TCCTACAGAC 
CCGCTACCTC TAAATGATGG AACATCTATC TTTGAAATTG CTGAAAAAGA GCTACTAGAA 
ATAGACGCTT ATCAACTGTA G

Protein sequence

MRSVITYLRF SSAIQGAEGA DSTRRQNDLF KQWLKKNSDA QVVASFSDEG LSGYKGKHLT 
GQFGDMLARI ESGEFPEGTL LLVEAIDRIG RLEHLETEAL MNRIIAHGIE IHTLQDGLIY 
TRDALSDDLG ISIIQRVKSY VAHQESKQKS FRVSQKWKQR AKLALAGEQR LTKMVPGWID 
PDTFKLNEHA ETVRLIFKLL LSGESLHNIA RHLQANNISS FSRRKDANGF SVHSVRTVLR 
SESVIGTLPA SQRNDRPAIP NYYEAAIDAS TFNKAQEILD KNRKGRTPAS DNPLTINIFK 
GLFRCQCGAS VHPTGTKNKY AGVYRCNNNP DGRCDVPPLK RKPFDKWMID NFLGMIDVGN 
DGEAEGKIAS LQHEVEIVTT RIKKATALLL EMDDITELKA QVKELNQKRT ELQTTIDSMR 
RKTSLSDKGL PQLKDIDLMT KAGRVECQLI LSKHLKGLTL GKDSVTVTLQ NDTEIIVPTD 
PLPLNDGTSI FEIAEKELLE IDAYQL