Gene TM1040_1300 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1300
Symbol
ID	4078499
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	1392128
End bp	1393741
Gene Length	1614 bp
Protein Length	537 aa
Translation table	11
GC content	59%
IMG OID	638006608
Product	phage portal protein, lambda
Protein accession	YP_613295
Protein GI	99081141
COG category	[R] General function prediction only
COG ID	[COG5511] Bacteriophage capsid protein
TIGRFAM ID	[TIGR01539] phage portal protein, lambda family

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.616273
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCTGGC GACTGTTCAG ACGCGAAGAT CCTGTTGCGC CGGAGCCGGA TCGCAAGCCC 
CCTCCAATGC TGACGGCACC CCGAAGGCGT GGCCAGCGCA TGTTTGCCGC CGCAGAGACA 
GATCGCATGA CAAGCGGTTG GACCAATTCA CCAATGCCAG CGGATCAAAT CATCCGCCGC 
AATTGGCGCG TGCTGGTGGC ACGTTCGCGC GAGCAGTCGG CGAACAACGA CTATGCAAAG 
GCGTTCAAGG CCAGCGCACG GCGAAACCTG ATTGGACAGA AGGGGTTCAC ACTGCAGGCG 
CAGGCGTTTG ACGGTGACAA GCTGGACGCA CAGGCAAACA AGGCCATCGA ACGCGCATGG 
CGCGCCTGGT GCAAGGCGAT GAATTGCGAC GTCAAAGGGC GTCGCACCTT ACGGCAGATC 
CAGAAAACGA TTGTGAACGG CCTTTGCACC GATGGCGAGT TTATGGTGCG CATGGTGGTT 
GGGCGGGATG CGGGCCCGTG GGGATTTGCA TTGCAGATCC TCGACCCGGT GTTGTGCCCG 
GTCGATTTTG ATGAGGATCG TCGCCCCGGT GGTGGGTTCA TTCGGGCAGG GATCGAATAT 
ACGAAGATGG GCCGACCCGT GGCCTATTAT TTCACCACCC TCGATCAATC GCAGGCCGAT 
TATCACTATT CCGGGCGGGC GTTCATCCGG GTTCCGGCGG ATGAAATTAT CCACTGGTTT 
GAAGAGGATT TTGTCGGGCA GAAACGCGGG CTGCCGTGGA TGGCGACCGC GCTCTTGCGT 
ATGCGCCAAC TTGGCGAGTT CGAGAAAAGC GCTCTGAACA ACGCTCGTGA AGGCGCGAAC 
AAGGTCGGCG TGATCGAATG GGACGAAGGG TTCGGCCCTG AGCCAGAAGA GGACGACGCC 
ACCAAGAGCG ACGATGATCT AGGCTTTGAG GACATCGAAC TCGATAGTGA AATGGGAGTT 
TATCATCAGC TCCCGATGGG TGCGCGTCTA AAGCGGGTCG AAACCGGATA TCCAAACGGC 
GAAATGGCGG TGTTTTCAAA GCACATGCTG CGCGGGGTCG CGACAGGCTT GGGCGTTGCC 
TACAACGATC TTGCCAATGA CCTTGAGGGC GTGAATCTAT CGAGCATCCG CCACGGCGTT 
TTGAGTGAGC GGGACCAGTG GATTGAGTTG CAAGAGAGCC TGATCGAGGC CTTTGCCTTG 
CCGATCTATG AGCGTTGGCT CGAATACTCG CTGCTGAAAC AGAAAATCAC CCTCGACAAC 
GGATCGCCGC TGCCAGCGAG CAAGCGGTCG AAGTTCATGG CGGTGACCTT CCAGGCACGG 
CGCTGGCAGT GGATTGATCC TGCAAAAGAC GTGACGGCCG ACGCCGACGC CGTCGACAAC 
CTGTTCAAGT CGCGCGGTCA GGTGATCCGC GAGCGCGGGC GCGACCCGCG CGAGGTCTAT 
GCCGAGGTCG CAGAAGATAT CGCAGCGATG CGCGAGGCGA AAATCCCCGA CAACGTGATC 
GAGGCCTTGA TCACAGCCAA ATCAAAAGGA GGGCAGGGCA GTGGACAGCC AGCCAAAACC 
GGCACCGGAG AAACCGACCC AGACGCCGAC CCAGACCCCG ACAAAAGCGA ATGA

Protein sequence

MIWRLFRRED PVAPEPDRKP PPMLTAPRRR GQRMFAAAET DRMTSGWTNS PMPADQIIRR 
NWRVLVARSR EQSANNDYAK AFKASARRNL IGQKGFTLQA QAFDGDKLDA QANKAIERAW 
RAWCKAMNCD VKGRRTLRQI QKTIVNGLCT DGEFMVRMVV GRDAGPWGFA LQILDPVLCP 
VDFDEDRRPG GGFIRAGIEY TKMGRPVAYY FTTLDQSQAD YHYSGRAFIR VPADEIIHWF 
EEDFVGQKRG LPWMATALLR MRQLGEFEKS ALNNAREGAN KVGVIEWDEG FGPEPEEDDA 
TKSDDDLGFE DIELDSEMGV YHQLPMGARL KRVETGYPNG EMAVFSKHML RGVATGLGVA 
YNDLANDLEG VNLSSIRHGV LSERDQWIEL QESLIEAFAL PIYERWLEYS LLKQKITLDN 
GSPLPASKRS KFMAVTFQAR RWQWIDPAKD VTADADAVDN LFKSRGQVIR ERGRDPREVY 
AEVAEDIAAM REAKIPDNVI EALITAKSKG GQGSGQPAKT GTGETDPDAD PDPDKSE