Gene Sala_2002 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_2002
Symbol
ID	4082167
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	2111214
End bp	2112320
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	72%
IMG OID	638010378
Product	Phage portal protein, HK97
Protein accession	YP_617046
Protein GI	103487485
COG category	[S] Function unknown
COG ID	[COG4695] Phage-related protein
TIGRFAM ID	[TIGR01537] phage portal protein, HK97 family

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.443505
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.004041
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAACTGGT TTGGCCGGAA GGCTGCGCAG GGGGCTGCGC GGCCCGCTTT GTCGCGGGTG 
TATGGGAGCT GGTCGGCGCC TGCGCCGCTG TCGTGGGAAG CGCAGGTGCG CGAGGGGTAT 
CTGGCGAATG CGATCGTGCA GCGCAGCGTG CGGCTGGTGG CCGAGGCGGC GGCGAGTGCG 
CCGCTGGAGG CGAGCGATCC GGGGCTCTTG GCGCTGGTTT CGGCGACGTC GGGCGGGCAG 
GGGCTGCTTG AGACGCTGGC GTCGCACCTG TTGCTGCACG GCAATGGCTA TGTGCAGATT 
TTGACCGATG GCGCGGGGGC GCCGGCCGAG CTGTTCGCGC TGCGCCCCGA GCGGGTGACG 
GTCGAGGCCG ACGCGCGCGG GTGGCCGGTG GCCTATCGCT ACAAGGCGGG CGGGTCGGCG 
GCGGTCCTGC CCGCCGAGGA TGGCGCGGGG CGCGTCGCGG TGGTGCATGT GAAGGCGCTG 
CATCCGCTCG ACGATCATTA TGGCGCGGGG TGCCTGGGCG CCGCGGCGGG GGCGATCGCG 
GCGCATAATG CGGCGGCGAA GTGGAATGCG GCGCTGCTGG AGAATGCGGC GCGGCCGTCG 
GGGGCGCTGG TCCATGATCC GGGCGACAAG GGGATGCCGC TGTCGGCCGA GCAGGTCGAG 
CGGCTGCGCG AGGAACTGGC CGAGAGTTTT TCGGGGCGTG CCAATGCCGG GCGGCCCTTG 
CTGCTGGAGG GTGGCCTCCG GTGGCAGGCG CTGTCGCTGT CGCCCGCCGA GATGGATTTC 
CTGGCGCTGA AGGATTCGAG CGCGCGCGAG ATTGCGATGG CGTTCGGGGT GCCGCCGATG 
CTGCTGGGGC TGCCGGGGGA CGCGACCTAT GCCAATTATC GCGAGGCCAA TCGCGCGCTG 
TGGCGGCTGA CGGTGCTGCC TTTGTGCGCC AAGATATTGG GGGCGATCGC GCAGGGGCTG 
TCGGGCTGGT TCGACGGCGC CGAGCTGCGC GTCGACCTCA ACAAGCTGCC CGCGCTGGCC 
GAGGACCGGA TGGCGCTGTG GCGCGAGGTG TCGGGTGCCG ACTGGCTGAG CGCGGACGAG 
AAGAAGGCGC TGCTGGGGGT GGCGTAG

Protein sequence

MNWFGRKAAQ GAARPALSRV YGSWSAPAPL SWEAQVREGY LANAIVQRSV RLVAEAAASA 
PLEASDPGLL ALVSATSGGQ GLLETLASHL LLHGNGYVQI LTDGAGAPAE LFALRPERVT 
VEADARGWPV AYRYKAGGSA AVLPAEDGAG RVAVVHVKAL HPLDDHYGAG CLGAAAGAIA 
AHNAAAKWNA ALLENAARPS GALVHDPGDK GMPLSAEQVE RLREELAESF SGRANAGRPL 
LLEGGLRWQA LSLSPAEMDF LALKDSSARE IAMAFGVPPM LLGLPGDATY ANYREANRAL 
WRLTVLPLCA KILGAIAQGL SGWFDGAELR VDLNKLPALA EDRMALWREV SGADWLSADE 
KKALLGVA