Gene Sala_2105 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_2105
Symbol
ID	4080080
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	+
Start bp	2211590
End bp	2212690
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	64%
IMG OID	638010481
Product	transposase, IS4
Protein accession	YP_617147
Protein GI	103487586
COG category	[L] Replication, recombination and repair
COG ID	[COG3666] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGGGGG ACGACATTGG GACGGAGAGG CTGTTTTCCT ATGTGAGTTG CGAGGCTCGG 
GTTTCTGCGA GCCATCCGCT TCGGCCGATC CGGGCGATTG TCGATGAAGT GCTGGAGGTG 
CTGCCGGCCG ATTTTGAGGG GATGTACGCG AAGACGGGGC GTCCCTCGAT CGCGCCTGGG 
AAGCTGCTGC GCGCGTTGCT GCTACAAGCC TTTTATTCGA TCCGATCGGA ACGCCAGTTG 
ATGGAGCAGA TGGACTACAA TCTGCTGTTC CGCCGGTTCG TGGGTCTGTC GATGGATGCG 
GCGGTTTGGG ACGCCTCGGT GTTCACCAAG AACCGTGATC GGCTTCTGGA AGGCGATGTG 
GCGACCAGGT TCCTCGCCGC GGTCGTGGCG CAGGCCCGAG GCCGCGATCT CCTTTCAGAC 
GAGCATTTCT CGGTGGACGG CACGCTGATC GACGCCTGGG CTTCGATGAA GAGCTTCCGC 
CCCAGGGATG ATGGCGAGGG ACCGGCGGGG GCCGGGCGCA ATGCCGAACG CGACTTTCGC 
GGCGAGAAGC GGTCGAACCA GACGCATGCC TCGACCACCG ATCCCGAAGC GAAGCTCTAT 
CGCAAGGCCA ACGGTCAGTC GTCGCGCATG GCCTTCATGG GGCATGGGCT AATGGAGAAC 
CGCAATGGCC TGGTGGTCGG CGCGCTCGTC ACTCAGGCCA CAGGCACCGC CGAACGTGAG 
GCGGCACTGG TTTTGGTCGA TGAACTCAAA GCCACCGGCC GCATCACCCT GGGCGCGGAC 
AAGGCTTACG ACGCACGCGC GTTCGTTCAG GCTCTGCGCG CCCGCAAGGT CACGCCGCAT 
ATCGCTCGCA ACGAGCAGAT CAACCAGGCC GGTGAACGAC GACGCAGAAG CGCCATCGAC 
GGTCGCACCA CCCGCCATCC CGGCTACGCC ATCAGCTTGG CGGTTCGCAA GCGGATCGAA 
GAAGTGTTCG GTTGGGCCAG GACCGTCGGT GGCCCGCGTA AAACGCGCCA CAAGGGCACC 
GATCGCGTCG GCCAGGCTTT CACCTTGACC GCCGCCACCT GCAACCTCGT CCGGCTGCCG 
AAGCCAATGG TGGCCGCATG A

Protein sequence

MRGDDIGTER LFSYVSCEAR VSASHPLRPI RAIVDEVLEV LPADFEGMYA KTGRPSIAPG 
KLLRALLLQA FYSIRSERQL MEQMDYNLLF RRFVGLSMDA AVWDASVFTK NRDRLLEGDV 
ATRFLAAVVA QARGRDLLSD EHFSVDGTLI DAWASMKSFR PRDDGEGPAG AGRNAERDFR 
GEKRSNQTHA STTDPEAKLY RKANGQSSRM AFMGHGLMEN RNGLVVGALV TQATGTAERE 
AALVLVDELK ATGRITLGAD KAYDARAFVQ ALRARKVTPH IARNEQINQA GERRRRSAID 
GRTTRHPGYA ISLAVRKRIE EVFGWARTVG GPRKTRHKGT DRVGQAFTLT AATCNLVRLP 
KPMVAA