Gene Sala_0074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_0074
Symbol
ID	4082147
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	80291
End bp	81436
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	64%
IMG OID	638008435
Product	thioredoxin-like protein
Protein accession	YP_615133
Protein GI	103485572
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.246531
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAAGGGCT GGCACGCATC AGAAGGAAAT AGGTCAATGC TACGCAAAAG ACGCGGTTTG 
GGATTTGCGG CGATCGCGGT TACCGCGGCG ATCGGCGCGG TCGTCTATTG CTTCGGCGAC 
ATACCGGGCG GCCGCTTGAA CCCGACGCCC AGCCCGATCC CGAGCGCCGC CGCCGCCGAA 
TATCCCGGCC AGCCGCTTGT GGCCCTTGCC GGCAACGGTC CCTGGCTCAA CACGACTGAG 
CGCACGCCGC AGGCACTGCG CGGCAAAGTC GTTCTTGTCA ATTTCTGGAC CTATTCGTGC 
ATAAACTCGC TGCGGCCCCT GCCCTATATT CGCGACTGGG CCGCGAAGTA TAAAGACGAC 
GGTCTGATCG TCATCGGTGT CCACACACCC GAATTCGCTT TCGAAAAGGA TGGTGACAAG 
GTCCGACGCG CCGTGGCGGA ACTCGGCGTC ACCTGGCCGG TCAAGCTCGA CAGCGACTAT 
GCGACCTGGA GGCTGTTCGG CAACGACGGC TGGCCAGGAT TCTATTTCAT CGATGCCAAA 
GGCCAGGTCC GCCACCATCG TCTCGGCGAG GGCGATTATG CGGCGTCCGA ACGGCTGCTC 
CAGCAACTCC TCGCCGAAGC CAAGGCTGCG CCAATCAATG AAAAACTGAC TGGCGACATC 
GGCAAGGGGA TAGAGGCGGC TCCCGATTGG GACCAACTGC GCTCGCCCGA GACCTATGTC 
GGATACCGAC AGGCCGACCG CCTCGCCGCG CCGCAACGGT TGAAGCGGGA CGCTCCCCTC 
ACCTATAGCC TTCCCTCTTC CGTCCCGGCC AACCAATGGG GCTTGGGCGG AGCATGGACC 
GTCGGCGCCG AGTCCGCACG CGCCGACGCC GCGTCGGCGA AGATACGCTA TCGCTTCGAG 
GCGCGTGACC TGCACATGGT CCTCGGCGCG CGCGGCGACG GAACACCCGC CCGCTTCCGC 
GTGACGCTCG ATGGTTTGCC GCCCGGAACA GATCATGGTG TGGATACCGA TGCGAACGGC 
ATGGGCACCG TTACCAAGGA CAGGCTCTAC CAGCTCGTTC GCCAGTCCGC GGCCGTCAGA 
GCCCGGACAT TCGAGATCGA ATTCCTCGAC CCCGGTGCTC GCGCCTATGT CTTCACCTTT 
GGATAG

Protein sequence

MKGWHASEGN RSMLRKRRGL GFAAIAVTAA IGAVVYCFGD IPGGRLNPTP SPIPSAAAAE 
YPGQPLVALA GNGPWLNTTE RTPQALRGKV VLVNFWTYSC INSLRPLPYI RDWAAKYKDD 
GLIVIGVHTP EFAFEKDGDK VRRAVAELGV TWPVKLDSDY ATWRLFGNDG WPGFYFIDAK 
GQVRHHRLGE GDYAASERLL QQLLAEAKAA PINEKLTGDI GKGIEAAPDW DQLRSPETYV 
GYRQADRLAA PQRLKRDAPL TYSLPSSVPA NQWGLGGAWT VGAESARADA ASAKIRYRFE 
ARDLHMVLGA RGDGTPARFR VTLDGLPPGT DHGVDTDANG MGTVTKDRLY QLVRQSAAVR 
ARTFEIEFLD PGARAYVFTF G