Gene Spro_1738 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_1738
Symbol
ID	5604713
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	-
Start bp	1915283
End bp	1916248
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	57%
IMG OID	640937270
Product	alkanesulfonate transporter substrate-binding subunit
Protein accession	YP_001477970
Protein GI	157369981
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01728] ABC transporter, substrate-binding protein, aliphatic sulfonates family

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.159271
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0882717
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACGAC TTTCTTCACT GGGCCGTTGG CTGGGCACCA GCGCATTGGC AGGCATCCTC 
TCATTGGCCT GGACCAATGC CGCCAGCGCA CAGGATCCGG CGCAGTTTCG CATTGGTTAC 
CAAAAGGGAT CGGTCAGTCT GGTACTGGCA AAAACCCATC GGCTGTTGGA ACAGCGTTTT 
CCCAACACCA AAATCAGTTG GATCGAATTC CCCGCCGGCC CGCAAATGCT TGAAGCGCTG 
AACGTCGGCA GTATCGATCT GGGCAGTACC GGCGATATTC CGCCGATCTT CGCCCAGGCC 
GCCGGAGCGG ACCTGCTGTA TGTTGGCGTA GAGCCACCAA AACCCAAGGC AGAAGTGATC 
CTGGTGCCAG AAAACAGCCC GATCAAAACC GTCGCGGAGC TAAAGGGCCA CAAGGTGGCC 
TTCCAGAAAG GCTCCAGCTC CCACAATCTG CTGCTGCGCT CATTGCAAAA AGCCGGGCTG 
AAATTCACCG ATATTCAGCC CGTCTACCTG ACTCCGGCCG ATGCCCGCGC CGCCTTCCAG 
CAGGGCAATG TCGATGCCTG GACAATTTGG GATCCCTACT ATTCCGCGGC CTTGTTGCAG 
GGTGGCGTGC GGGTACTGGG TGACGGTACC GATTTGAATC AAACCGGCTC CTTCTATCTG 
GCGGTGCGAA CTTATACCGA GGCCAATGGA CCCTTTATTC AACAGGTACT CGATACGCTG 
ACCCAGGCTG ATGCGCTGAC CCTAAGCGAC CGTGCGCAAA GCGTCACGCT GCTGGCCAAT 
GCCATGGGCC TGCCGGATAA AGTGATTTCG ACCTATTTGG ATCACCGCCC GCCCACCGCC 
ATCAAACCTC TGGATGCGCA CACCATAGCC GCTCAGCAGC AAACGGCCGA TCTGTTTTAT 
GCCAACCGCC TGGTGCCGGT GAAAGTCGAT ATTTCGCAAC GCATCTGGCA CCCAAGCGCA 
CAATAA

Protein sequence

MKRLSSLGRW LGTSALAGIL SLAWTNAASA QDPAQFRIGY QKGSVSLVLA KTHRLLEQRF 
PNTKISWIEF PAGPQMLEAL NVGSIDLGST GDIPPIFAQA AGADLLYVGV EPPKPKAEVI 
LVPENSPIKT VAELKGHKVA FQKGSSSHNL LLRSLQKAGL KFTDIQPVYL TPADARAAFQ 
QGNVDAWTIW DPYYSAALLQ GGVRVLGDGT DLNQTGSFYL AVRTYTEANG PFIQQVLDTL 
TQADALTLSD RAQSVTLLAN AMGLPDKVIS TYLDHRPPTA IKPLDAHTIA AQQQTADLFY 
ANRLVPVKVD ISQRIWHPSA Q