Gene Ent638_3101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_3101
Symbol
ID	5112641
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	+
Start bp	3375316
End bp	3376503
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	47%
IMG OID	640493300
Product	phage integrase family protein
Protein accession	YP_001177816
Protein GI	146312742
COG category	[L] Replication, recombination and repair
COG ID	[COG0582] Integrase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.241472
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCGGA TCACACGCCC CCTAACTAAC AACGAAATTC TTAAAGCTAA ACCTCGCGAA 
AAAGACTTTA CCCTCCATGA TGGGGACGGC TTGTTCTTAC TCGTCAAAAC CTCTGGTAAA 
AAACTCTGGC GTTTTCGCTA CCAGCGACCA AACAGCACCA GCCGTACAAA TCTCAGCCTT 
GGCGCATATC CTGCCCTTAC GCTTGCAGCA GCCCGTCTGA TACGCGATCA GCATTTGTCT 
CTCTTAGCAC AGGACATAGA TCCTCAGCAG CAACAAGAAA TAGTCTCAGA ACAGCGCCAA 
ATAAAGCTGG ACAGCGTTTT CTCTACAGTT GCCGCCAATT GGTTCCAGCT AAAGAGCAAA 
AGCGTAACAC CGGATTATGC AAAAGACATT TGGCGCTCAT TAGATAAAGA CGTGTTCCCT 
GCTATTGGCG AGATACCAGT TCAAGAGATC AAAGCCAGAA CTATTATTGA AGCGCTTGAG 
CCTATCAAAG CGCGTGGAGC ACTGGAAACA GTTCGTCGTC TTGTACAGCG TATCAATGAG 
ATTATGATTT ATGCGGTAAA TACCGGCTTG CTTGATGCCA ACCCAGCGTC AGGGGTTGGA 
ATGGCTTTTG AGAGACCCAA GAAGCAAAAT ATGCTTACGC TTCGACCAGA AGAATTGCCC 
AAGCTGATGC GTTCAATAGG CATGTCAAAT CTGTCTGTTC CAACTCGCTG CCTAATCGAA 
TTGCAGCTCC TCACCCTTGT TCGCCCTTCA GAAGCTTCTG GTGCTCGATG GGCAGAGATT 
GATATCGATG CAAAGCTTTG GAAAATCCCA GCAGAACGGA TGAAAGCGAA GCGTGAACAC 
ATTGTACCTT TATCTCCTCA GGCGTTAGAG ATTCTAGAGA TTATGACGCC TATCAGTGCG 
CATCGCGAGT ATGTGTTTCC AAGCAGGAAT GATCCAAAGC AACCCATGAA TAGCCAGACG 
GCTAATGCGG CTATAAAGCG TATTGGCTAT GGAGGCCGTC TAGTTGCACA TGGTCTTCGT 
TCTATCGCAA GTACAGCGAT GAATGAGGAA GGATTTAATC CTGATGTTAT TGAAGCGGCA 
TTAGCCCATA GTGATAAAAA TGAAGTTCGT CGAGCATATA ATAGATCTAC ATACCTTGAA 
GCACGGAGAG AACTAATGGA TTGGTGGGGT TCAGCCATAT ACAAATAA

Protein sequence

MARITRPLTN NEILKAKPRE KDFTLHDGDG LFLLVKTSGK KLWRFRYQRP NSTSRTNLSL 
GAYPALTLAA ARLIRDQHLS LLAQDIDPQQ QQEIVSEQRQ IKLDSVFSTV AANWFQLKSK 
SVTPDYAKDI WRSLDKDVFP AIGEIPVQEI KARTIIEALE PIKARGALET VRRLVQRINE 
IMIYAVNTGL LDANPASGVG MAFERPKKQN MLTLRPEELP KLMRSIGMSN LSVPTRCLIE 
LQLLTLVRPS EASGARWAEI DIDAKLWKIP AERMKAKREH IVPLSPQALE ILEIMTPISA 
HREYVFPSRN DPKQPMNSQT ANAAIKRIGY GGRLVAHGLR SIASTAMNEE GFNPDVIEAA 
LAHSDKNEVR RAYNRSTYLE ARRELMDWWG SAIYK