Gene Sala_1921 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_1921
Symbol
ID	4082778
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	2024692
End bp	2025897
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	70%
IMG OID	638010298
Product	glycosyl transferase, group 1
Protein accession	YP_616966
Protein GI	103487405
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID	[TIGR03087] sugar transferase, PEP-CTERM/EpsH1 system associated

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGAAA TCCTGTTCCT CGTGCATCGC GCGCCGTGGC CGCCCGACCG CGGCGACCGC 
ATCCGCAGCT GGCATATGTT CGAGGCGCTG GCGAAACTGG CGCCGGTGCA TGTGGCGGCG 
CTCGCCGATA ATGATGCCGA TGCCGCACTT GCGCGCGCGA AACTGGCGCC GCTTTGCAAG 
AGCCTGGCGA TCGAAGGGCG CCGGGTGTCG CGTCCGATCG CCTTGGCAGA GGCCGTGCTG 
CGCCGTGAGC CGGTGTCGAT CCACCTGTTT CGGAGCAAGG CCCTGGCGCG TCAGGTCGAT 
GCGCTGATCG GGCGGGGCGA CATCAGCCAT ATCGTCGCCT TTTCGGGGCA GATGGCGCAA 
TATCTGCCCG CCCGGTTCGA CGGCCCGGTG CTGATGGATT TCGTCGACGT CGATTCGGCC 
AAGTTCGGCG CCTACGCCAA GCAGGACAGG CGCCAGCCGC TCAACTGGGT GCATCGGCGC 
GAGGCGCGGG TGCTCGGCGC CTATGAGGTC GGGATCGCGC GGCGCGTCGC CGCCAGCCTG 
TTCGTCAGCG AGGCCGAAGC GGCGCTCTTT CGGCAAAAGA GCGGGTTGGC GGCCGATAAG 
GTGCTGGCGG TCGGGAACGG GATCGACACC GATCGTTTCG ACCCGGCGCT GCCGTTTGAT 
CCGGTGGGTC ATGGCGACGG GCCGCTTGCG GTGTTCACCG GGCAGATGGA CTATCGCCCC 
AATATCGACG CGGCGCGCTG GTTCGCCGCC GATATTTTGC CGCTGATCCG GCGGCGACAC 
CCCGCGGCGC GCTTCGCGGT CGTCGGGCGC GCGCCGAGCG CGGAGGTGCG CGCGCTCGCG 
AAGCAGCCCG GCGTGATCGT GACCGGCGAA GTGCCCGACG TGCGGCCGTG GCTTGCCGCC 
GCCGACGCGG TGGTGGCCCC GCTCCTGCTC GCGCGCGGTG TGCAGAACAA ATTGCTCGAG 
GCGATGGCGA TGGCGCGACC GGTAGTGGCG AGCGCCGCCG CGGCGACGGG AATCGACGCG 
GCGCCGGGCG AACATCTGCT CGTCGCGGAT GATGCCGCGG CGATGGCCGA CGCGGTGTGC 
ATGCTGTTCG GCGATCGCGA TGCGGCGGCG CACATGGGAC AGGCGGCACG CGCACGGATG 
ATCGCGCGCT ATGGCTGGGA CGCGCGCATG GCGCCGCTTG GCGCATTGCT GGGGCTGCCC 
GCATGA

Protein sequence

MPEILFLVHR APWPPDRGDR IRSWHMFEAL AKLAPVHVAA LADNDADAAL ARAKLAPLCK 
SLAIEGRRVS RPIALAEAVL RREPVSIHLF RSKALARQVD ALIGRGDISH IVAFSGQMAQ 
YLPARFDGPV LMDFVDVDSA KFGAYAKQDR RQPLNWVHRR EARVLGAYEV GIARRVAASL 
FVSEAEAALF RQKSGLAADK VLAVGNGIDT DRFDPALPFD PVGHGDGPLA VFTGQMDYRP 
NIDAARWFAA DILPLIRRRH PAARFAVVGR APSAEVRALA KQPGVIVTGE VPDVRPWLAA 
ADAVVAPLLL ARGVQNKLLE AMAMARPVVA SAAAATGIDA APGEHLLVAD DAAAMADAVC 
MLFGDRDAAA HMGQAARARM IARYGWDARM APLGALLGLP A