Gene Spro_3738 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_3738
Symbol
ID	5607429
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	+
Start bp	4127514
End bp	4128713
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	62%
IMG OID	640939290
Product	major facilitator transporter
Protein accession	YP_001479962
Protein GI	157371973
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.346583
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCAAC AACATTCACA GCCGGGTCTC AGCCCGGCGC TGATCGTGCT GATCGCCATC 
GCCACCGGTC TGGCGGTCGC CAGTAACTAT TATGCCCAGC CGCTGCTGGA AACCATCGCC 
CAGAACTTCG ATTTATCGGT CAATCAGGCC GGCTTTATCG TCACTGCCGC CCAGTTGGGC 
TACGCCGTTG GCCTGCTGTT GCTGGTGCCA CTCGGCGATA TGTTTGAACG CCGCGGCCTG 
ATCGTCTTTA TGACGCTGCT GGCGGCGGGC GGCATGCTGA TCACCGCCAG TTCCACGACC 
TTGCCGATGA TGATCCTCGG GACCGCGCTC ACCGGGCTGT TCTCGGTGGT GGCGCAAATT 
CTGGTGCCAC TGGCGGCCAC CCTGGCCCAT CCGGAAAAAC GCGGCAAAAC CGTCGGCATT 
ATCATGAGCG GCCTGCTGCT CGGCATTCTG TTGGCGCGCA CCGTAGCCGG AGCGCTGGCG 
TCACTCGGCG GCTGGCGCAC CATCTACTGG GTCGCCAGCG TGCTGATGAT CCTGATGGCA 
TTGATCCTGT GGCGCGCACT GCCGCGTTAC AAGCAGCATT CGGGGCTGAA TTACCCGCAG 
TTGCTGAAAT CGATCTTCAC CCTGTTTTGT GGTACTCCGC TGCTGCGTAC CCGCGCGATA 
CTCGGGGCGC TGTCGTTCGC CAACTTCAGC GTGCTGTGGA CTTCGATGGC CTTTTTACTG 
GCGGCTCCGC CGTTTGGTTA TTCCGAAGGG GTGATTGGTC TGTTTGGCCT GGTCGGCGCT 
GCCGGCGCAT TGGCGGCTTC ACGCGCCGGG CATTTGGCGG ATCAGGGTAA GGCCGGTTTA 
ACCACCAGCG TGGGCCTGGT CCTGCTGCTG CTTTCCTGGA TACCCATCGC TTTCGCTAAA 
CAATCCCTGT GGGCGTTGAT CGCCGGTATC CTGATCCTCG ACCTGGCCGT GCAGGCCGTA 
CACGTCACTA ACCAGAGCGT GATTTACCGC ATTATGCCGG AAGCGCGCAA CCGCCTGACC 
GCCGGCTACA TGACCAGCTA TTTCATCGGG GGGGCACTCG GCTCACTGCT GTCTGCCTCG 
GCCTATCAAC ATGCGGGTTG GACCGGCGTT GCCGTGGCCG GGGGCGTTTT GTGCCTGCTC 
AACCTGCTGA CCTGGTGGCG CGGCAAGCAC CACGATCCGC AAGGACCGGC GACAATCTGA

Protein sequence

MSQQHSQPGL SPALIVLIAI ATGLAVASNY YAQPLLETIA QNFDLSVNQA GFIVTAAQLG 
YAVGLLLLVP LGDMFERRGL IVFMTLLAAG GMLITASSTT LPMMILGTAL TGLFSVVAQI 
LVPLAATLAH PEKRGKTVGI IMSGLLLGIL LARTVAGALA SLGGWRTIYW VASVLMILMA 
LILWRALPRY KQHSGLNYPQ LLKSIFTLFC GTPLLRTRAI LGALSFANFS VLWTSMAFLL 
AAPPFGYSEG VIGLFGLVGA AGALAASRAG HLADQGKAGL TTSVGLVLLL LSWIPIAFAK 
QSLWALIAGI LILDLAVQAV HVTNQSVIYR IMPEARNRLT AGYMTSYFIG GALGSLLSAS 
AYQHAGWTGV AVAGGVLCLL NLLTWWRGKH HDPQGPATI