Gene Spro_4221 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_4221
Symbol
ID	5603175
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	-
Start bp	4680442
End bp	4681845
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	57%
IMG OID	640939781
Product	Beta-glucosidase
Protein accession	YP_001480443
Protein GI	157372454
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2723] Beta-glucosidase/6-phospho-beta-glucosidase/beta-galactosidase
TIGRFAM ID	[TIGR03356] beta-galactosidase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0294315
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGTAT TTCCGAAGGA TTTCCTGTGG GGCGCGGCGA CCGCGTCTTA CCAGGTTGAG 
GGCGGCTTTG ATGCCGACGG CAAGGGCCTG TCCAACTGGG ACTTGTTCTC CCACCTGCCC 
GGCACCACTT ATCAGGGTAC CAACGGCGAC GTCGCGGTCG ATCACTACCA TCGCTTTCGC 
GAAGACGTAG CGCTGATGGC CGAATTGGGG ATGCAGACCT ACCGATTTTC GATCTCGTGG 
CCACGGTTGC TGCCGCAGGG GCGGGGCGAG GTGAATGAGG CCGGGATCCA ATTCTACAGC 
GATCTGATCG ACGAACTGTT GAAGCACAAC ATCAAACCGA TGATCACCCT GTACCACTGG 
GATCTGCCGC AGGCGCTGCA AGAAGAATTT GGCGGTTGGG AATCGCGTGA GATCGTCGAT 
GCTTTCGATG AATATGCCCG TCTGTGTTAT CAGCGTTTCG GCGACCGCGT CGAGCTGTGG 
TCTACCTTTA ACGAAACCAT CGTGTTTATC GGCATGGGCT ATATCACCGG AGCGCATCCG 
CCCAAGTTGA CCGATCCGAA GAAGGGCATT CAGGCCTGTC ACCATGTGTT CCTGGCCAAT 
GCCCGCGCGG TAAAAAGCTT CCGCGAAATG AAGATCAACG GTCAGATCGG CTTCGTCAAC 
GTGCTGCAAC CTAACGATCC GATCAGCGAC TCGCCAGAAG ATCGCCGCGC CTGCGAGTTA 
GCCGAGGGGA TCTTCACCCA CTGGCTGTAC GATCCGGTGT TGAAGGGCGA ATACCCGGCA 
GAGCTGTTGG CGATGGCGCA GCAGGCCTTT GGCGTACCTT ATTTTGCACC GGGCGATGAG 
GCGTTGCTGA AGGGCAACAT CGTCGATTTT ATCGGTCTTA ATTACTACAA GCGCGAAATG 
GTGGCACATA ACGACGATGT CGAGGGCTAC GCGATCAATA CCAGTGGCCA GAAGGGCAGC 
GGGCGTGAAC TGGGCTTTAA GGGGCTGTTC AAACTGGTGC GCAACCCGAA CGGGGTTTAT 
ACCGACTGGG ACTGGGAGGT TTATCCGCAG GGGCTGACCG ATGCCATTGG CCGCATCGTC 
AAACGCTATG GCAACATTCC GATCTACATT ACCGAGAACG GGTTGGGTGC CAAGGATCCG 
ATCGTCGAGG GGGAAGTGCG CGATCAACCG CGCATAGACT ATCTGCGCGA TCATATTCAG 
GCGATCGGTG CGGCGATCGA GCAGGGTGCC GATGTGCGCG GTTACTACCC CTGGTCGTTT 
ATCGATCTGC TTTCCTGGCT CAACGGCTAT CAGAAGCAGT ACGGCTTTGT GTATGTCGAT 
CACGACAACA ATCTGGCGCG CAAGAAGAAG CAGAGTTTTG GCTGGTATCA GCGGGTGATC 
GCCAGCCACG GTGAGCAGCT GTAA

Protein sequence

MSVFPKDFLW GAATASYQVE GGFDADGKGL SNWDLFSHLP GTTYQGTNGD VAVDHYHRFR 
EDVALMAELG MQTYRFSISW PRLLPQGRGE VNEAGIQFYS DLIDELLKHN IKPMITLYHW 
DLPQALQEEF GGWESREIVD AFDEYARLCY QRFGDRVELW STFNETIVFI GMGYITGAHP 
PKLTDPKKGI QACHHVFLAN ARAVKSFREM KINGQIGFVN VLQPNDPISD SPEDRRACEL 
AEGIFTHWLY DPVLKGEYPA ELLAMAQQAF GVPYFAPGDE ALLKGNIVDF IGLNYYKREM 
VAHNDDVEGY AINTSGQKGS GRELGFKGLF KLVRNPNGVY TDWDWEVYPQ GLTDAIGRIV 
KRYGNIPIYI TENGLGAKDP IVEGEVRDQP RIDYLRDHIQ AIGAAIEQGA DVRGYYPWSF 
IDLLSWLNGY QKQYGFVYVD HDNNLARKKK QSFGWYQRVI ASHGEQL