Gene Spro_4806 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_4806
Symbol
ID	5605477
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	-
Start bp	5325003
End bp	5325998
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	55%
IMG OID	640940379
Product	sulfate transporter subunit
Protein accession	YP_001481027
Protein GI	157373038
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1613] ABC-type sulfate transport system, periplasmic component
TIGRFAM ID	[TIGR00971] sulfate/thiosulfate-binding protein

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000221787
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCGTATGC GTAAATGGGG TGCAGGTCTG ACAATAATGC TGCTGGCGTC CGGCGCCATG 
GCGAAAGATA TCCAATTGCT GAACGTTTCA TACGACCCGA CGCGTGAGTT CTATCAGGAA 
TACAACACCG CATTCGGTAA ATACTGGCAG CAGCAGACCG GCGATAAAGT TACGGTGCGC 
CAGTCGCATG GCGGCTCCGG CAAGCAGGCG ACTTCGGTGA TTAACGGCAT TGAGGCCGAC 
GTGGTGACAC TGGCACTGGC CTATGACGTG GACGCTATCG CTGAGCGCGG GCGCATTGAT 
AAAGAGTGGA TCAAACGTCT GCCGGACAAC TCGGCACCTT ATACCTCGAC CATTGTGTTC 
CTGGTGCGCA AAGGTAATCC AAAGCAAATT CACGATTGGG CGGATTTGAT CAAACCGGGC 
GTCTCGGTAA TCACCCCGAA CCCGAAAACT TCCGGTGGCG CACGCTGGAA CTATCTGGCA 
GCCTGGGGTT ATGCACTGCA TCAGAACAAT AACGATCAGG CCAAGGCGCA AGAATTCGTT 
AAAAACCTGT ATAAGAACGT CGAAGTGCTG GATTCCGGTG CGCGCGGTTC AACTAATACC 
TTCGTTGAAC GCGGTATCGG TGATGTGCTG ATCGCCTGGG AGAACGAAGC GCTGCTGGCG 
GAAAAAGAGC TGGGCAAGGA CAAGTTTGAG ATTATCACCC CAAGCGAATC GATTCTGGCC 
GAGCCGACCG TGTCGGTGGT GGATAAAGTG GTTGATAAGC GCGGTACCCG TGATGTGGCT 
ACGGCTTACC TGAAGTATCT GTATACGCCG GAAGGGCAGA CCATCGCGGC GAAAAACTAT 
TACCGTCCAC GCGATGCGGC GGTAGCGGCC AAGTTTGCCG ACCAGTTCCC GAAACTGAAA 
CTGTTTACCG TGGATGATAC TTTCGGCGGC TGGACCCAGG CGCAGAAGGT GCACTTTGCC 
ACCGGCGGCG TGTTTGACGA AATCAGCAAA CGTTGA

Protein sequence

MRMRKWGAGL TIMLLASGAM AKDIQLLNVS YDPTREFYQE YNTAFGKYWQ QQTGDKVTVR 
QSHGGSGKQA TSVINGIEAD VVTLALAYDV DAIAERGRID KEWIKRLPDN SAPYTSTIVF 
LVRKGNPKQI HDWADLIKPG VSVITPNPKT SGGARWNYLA AWGYALHQNN NDQAKAQEFV 
KNLYKNVEVL DSGARGSTNT FVERGIGDVL IAWENEALLA EKELGKDKFE IITPSESILA 
EPTVSVVDKV VDKRGTRDVA TAYLKYLYTP EGQTIAAKNY YRPRDAAVAA KFADQFPKLK 
LFTVDDTFGG WTQAQKVHFA TGGVFDEISK R