Gene Sala_0447 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_0447
Symbol
ID	4082995
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	457723
End bp	458871
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	71%
IMG OID	638008805
Product	kelch
Protein accession	YP_615501
Protein GI	103485940
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.724357
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.84708
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATACGGA CCGTCTCGAT CACCCTGGCT CTGGTCATCG GACTTGCCGG CTGCGCGGCG 
AACGGGGAGG ATGCGGCCGG TCTGCAAGCC GCCGACCTTC GCTTCGAGGA CGGGCCGCGC 
CTCGGCGCGC CGCGGGCTGC CCATCAACTG ATCGCGACCG CGGACGGCAA GCTGCTGGCC 
ATTGGCGGAT GTGTGCGCTC GGGGTGCGAC GTCGGCCCCG CCAGCGCAAC CGTCGACATC 
ATCGATGCGG CAAGCATGGC GCTGATCGGC AGTGGCCGCC TGCTCGCCGC GCATGTCCAG 
CCATCGGCCG TCGCGCTGCG CGACGGCCGG GTGCTGATCA CGGGCGGCTG GATCGACGGG 
CGCCCGGCCA CGGCGATCGA GATATTCAAC CCCGCAACGG GCAGGTCGGT CGCGGGACCG 
GCGCTCGGCG GACCCCGCGC CAATCCCGCC GTCGTGGGGC TTGCCGACGG ACGCGTCCTG 
ATCGCCGGTG GTTATGACGG CCAGGATGCG CTCGGCGATG CGCTGATCTT CGATCCCGCC 
AGTGGAACGC TGTCGGCGAC GGGCAGGCTG GTCACGCCGC GCGCCGGGGC CAGCGCCACC 
CTGCTGTCCG ATGGCCGGGT GCTGTTGGTT GGTGGCGGCC GTGCCGAACG GAGCCCCCGG 
ATCGCGCTCG CGAGCGCGGA AATCTTCGAT CCGGCCACGG GGCGATTCGA GGCGGCCGGG 
TCGCTGGCCC AGGGACGCTA CAAGCATGGC GCGCTCCGGC TCGACAATGG CGACGTGCTG 
ATCGTCGGCG GCGCCACTGA ACGCGATTCC GCCGGGAAAC TGCGTTCGGT CGAACGGTTC 
GACGCGGCCA CGGGCCGCTT CGTGGTTGCG GGGCAATTGC TCGCCGGACG CTACAAGCTG 
GCCGATGCCC TGCTGCTACT GCCGGGCAAC CGCGTGCTCG TGGCGGCGGA CGACATGGCG 
CCCGAGATTT TCGATGTCGC GCGCGGCCGG AGCAGCCGGG TCGATTACGA TCTGGGCGAG 
CGCTGGAACT TCATGGCGAT GGTCCGTGTC GATTCGCGGC GGGCCCTGCT CGCCGGCGGC 
TACAGCGAAA AGGGGATCGA CCCGACCGAT CGAAGCTGGG TCATCCATCT GCCCACGGGG 
GCGTCGTGA

Protein sequence

MIRTVSITLA LVIGLAGCAA NGEDAAGLQA ADLRFEDGPR LGAPRAAHQL IATADGKLLA 
IGGCVRSGCD VGPASATVDI IDAASMALIG SGRLLAAHVQ PSAVALRDGR VLITGGWIDG 
RPATAIEIFN PATGRSVAGP ALGGPRANPA VVGLADGRVL IAGGYDGQDA LGDALIFDPA 
SGTLSATGRL VTPRAGASAT LLSDGRVLLV GGGRAERSPR IALASAEIFD PATGRFEAAG 
SLAQGRYKHG ALRLDNGDVL IVGGATERDS AGKLRSVERF DAATGRFVVA GQLLAGRYKL 
ADALLLLPGN RVLVAADDMA PEIFDVARGR SSRVDYDLGE RWNFMAMVRV DSRRALLAGG 
YSEKGIDPTD RSWVIHLPTG AS